MindMap Gallery 資訊組織(資訊檢索)資訊管理學
資訊資源管理考試研究 情報學 檔案學 資訊分析,包含概述、方法、網路資訊組織、知識組織等。乾貨滿滿,有需要的朋友趕快收藏吧!
Edited at 2024-02-12 16:56:34資訊組織
概述
概念
資訊整序
根據一定的組織規則,將採集到的無序資訊運用一定的技術方法對其內部特徵和外部特徵進行解釋和描述,使之從無序集合成為有序資訊集合的過程
組織對象
內部特徵
外部特徵
由其物理載體直接反映的
內容/步驟
選擇
序
有序:約束性,規律性
分析
邏輯關係
語意語用語法
內部外部特徵
細化挖掘加工整理
描述與揭示
特定需要
主題形式載體
著錄:外部特徵/標引:內部特徵
儲存
格式順序/特定載體
原則
客觀性
系統性
宏觀/微觀
與其他部門
採集/組織/傳遞/檢索
部門內部工作流程
不同技術的使用
滿足特殊性要求/統一標準
目的性
使用者
市場
機構
現代性
思想:標準化
技術:自動化
類型
特性
滲透
增效
依附
有序
方法(傳統)
理論基礎
語言學:符號載體
邏輯學:思維方法
系統論:整體,同一
協同論:子系統協同運作
耗散結構理論:無序到有序
自組織理論:自發性
思想方法
分類法
內容特徵,相互關係,等級結構
符號標識
簡單,明確,排序性好
方便,結構等級描述揭示,充分發揮分類法的作用
數字字母,通用性,不受語種限制
不直觀
一定角度,揭示聯繫
主要聯繫
先依傳統學科分類,下設細分新學科專業
主題法 與分類法比較定義
主題中心
語詞標識
字順排列,參考系統
分類-主題一體化
分類法/主題法/原理滲透,結構融合
學科體系,等級結構,邏輯排列 主題概念,字順排列,參考系統
分類詞表-敘詞表/敘詞表-分類詞表
資訊描述與揭示
檢索語言
基本原理
定義
功能
描述/一致性
集中/揭示
等級結構
參照系統
輪排聚類法
範疇分類體系
排列/序化
分類
字順
分類字順排列
相符性比較
分類
先組
後組
定組
理論基礎
概念邏輯
概念
事物本質屬性的概括/內涵加外延反變關係/種差加鄰近屬概念
依外延重合程度
相容概念
同一
屬種
交叉
整體與部分
全面與某一方面
不想排斥的並列
不相容概念
相互排斥的並列關係
對立
矛盾
概念邏輯方法
概念的劃分與概括
概念的分析與綜合
知識分類
系統研究事物的方法
分類:學科/事物
原則:客觀性/發展性
術語學
分類法
概述
定義
類目,規則,組織,標記符號,次序,知識分類,概念,概念邏輯,排列
特點
集中
揭示
字典
線性
功能
反映,邏輯,全貌,
系統,通用,族性
符合,依據,規範
主要的分類法
體系分類法/等級列舉
定義
概念邏輯,學科分類
類目,組成,體系
特點
學科,線性,等級列舉
先組定組
符號標記
結構
微觀(類目體系)
類目劃分
標準:內容,形式
過程
引用次序
類目劃分標準的引用次序
越前越集中
邏輯,目的,主題,需求
排列次序
系統,邏輯,統一,相關
同位類
類別名確定
科學性
確切性
間接性
相互關係
從屬
交叉
並列
相關
宏觀
類目體系
主表
基本部類
基本大類
簡表
詳表
複分錶
標記系統
純數字/數字字母混合
順序/層累/混合/分面標記
說明註釋
編製說明
大類說明
類目註釋
索引
直接索引
相關索引
分類主題對照
組配分類法/分面分類
定義
概念邏輯
複雜,簡單
分類
全分面分類:完全組配
半分面分類:體系 組配
特點
先組優 後組優
結構
編製說明,基本類別表,分面類別表,分面公式,通用輔表
分面分析法
基本
具體
引用次序/排列次序
標記系統
標記制度
分面標記制
分段
回溯標記制
直接加/不能輪排多路徑
標記符號(分面符號)
標點符號
數字或字母
主題法
概述
定義
語詞標識,字順排列,自由組配
主題中心,規範名詞,參考系統
特點(優 缺
規範名詞:專指
語詞標識:直觀
靈活組配:
主題中心:
功能
控制系統
引導
方便
主要的主題法
標題詞
標題列舉
先組
參照系統
單元詞
單元詞,後組,號碼相同可組配
優點
後組:靈活,適應,體積小,檢索途徑,擴檢縮檢
詞獨立/組配:每一個單元詞都可以作為檢索入口
缺點
字面組配
無參照系統
不直觀不繫統
關鍵字
原理
關鍵字,自然語言
字順
輪排
特點
優點:自然語言,關鍵字,輪排,自動
缺點:族,不揭露關係,輪排需要計算機
分類
題內
題外
詞對式
敘詞/主題詞
原理
定義
敘詞/主題詞,概念為基礎,規範化,組配功能,揭示關係,動態變化
敘詞法:單元概念,規範化,概念組配,後組
概念組配
敘詞表
主題詞選擇與規範
選擇
詞表範圍
文獻檢索要求,文獻成長
被選詞,檢索意義價值,頻率,完整明確
規範
詞形/同義
詞義/多義
範圍
先組度
詞間關係
用參照系統揭示
同義詞:正式詞/引導詞
屬分:專指度
相關
主題詞組配
原理:概念組配,後組
交叉:複合
限定:縮
聯結:只揭示關係
特點
敘詞標識
直覺
規範
後組
靈活組配
適應性/新
概念組配
揭示語意關係,網絡結構,系統性,族性
參照系統,範疇分類系統,等級系統,詞族圖
與其他檢索語言的關係
分類-主題一體化
網路環境下的檢索語言
分類語言(傳統與網路發展對比)
形式
電子化
傳統
網路:直覺方便/連結檢索/速度效率/成本修訂更新
多維化
超文本:改變線性,技術,體系多維
網路分類目錄:標準,關係,設類多維
內容
聚類標準主題化
類目劃分隨意性
類目排列非邏輯性
類名通俗性/穩定性
公眾分類法
趨勢
調整傳統
發展創新:網路分類目錄
主題語言
傳統
學業檢索:標題,敘詞
搜尋引擎:關鍵字
輔助詞表
後控詞表
禁用詞表
自然語言
優點
易用
準確
適應
後控詞表
差別
只用於檢索
部分控制部分關係
收詞豐富,動態
使用方便靈活,面向使用者/保障功能
優點
後控,對象,簡單
語意完整,檢索便捷,減輕負擔
自然 人工,查全,查準
資訊著錄
意義
概念
物件
目的
過程
結果
基本要求
準確性
規範化/標準化
作用
揭示
組織
資訊著錄
目錄組織
檢索
標識/資料記錄
資訊著錄的標準
機器讀目錄
特點
伸縮性強,適應面廣
包括 001~999 個字段,其中 999 個字段為使用者自訂的字段
字段內容著錄詳盡,字段下方又設子字段以及重複字段
字段作用強大,可檢索的字段多
每個 MARC 記錄可分為頭標區、目次區、資料區
元數據
概述
概念
關於數據的數據
描述,促進,協助,工具,組織
意義
物件
成分
通常是從資訊資源中抽取出來的用來說明其特徵、內容的數據,如題名、版本、出版數據、 相關說明等
結果
目的
作用
著錄與描述
基本功能
定位與檢索
無實體
抽取,語義,聯繫,示址
評價與選擇
描述,了解,判斷
資源管理
資源保護與長期保存
都柏林元數據(DC)
定義
是一種通用簡單的元數據,是一種跨領域的資訊資源描述標準,其中,資訊資源被定義為,任何具有標識的東西
應用
應用的資料型態沒有根本性的限制
包含15個元素,分為三種:資源內容相關,資源智慧財產權相關,資源外部屬性相關
各元素可選擇可重複可擴展,不同國家地區產業可以根據具體需求選擇全部或部分元素進行資源描述也可以增加其他必要元素
優點:簡單易懂,運用靈活,國際通用,可擴展性,語意互通性
都柏林元數據與機讀目錄
相同
本質:元數據
目的:資訊格式化
描述,著錄,檢索
不同
著錄內容
物件
網路/傳統
主體
非專業/專業
詳簡程度
簡/詳細
標識方法
單字詞組/數字字母
數據形式
15元素/三區(頭標/目次/資料)
評價
資訊標引
意義
定義
作用
承上啟下
目的
分類
主題標引
分類標引
步驟
主題分析
定義
中心思想,重點:結構,要素,關係
步驟
主題類型
單主題
單元主題
複合主題
多主題
顯性主題/隱性主題
主題結構
構成主題和各個基本主題的要素及其相互關係
目的:中心,動態,限定,主要/次要,選擇提煉確定
方面
主體因素
通用因素
位置因素
時間因素
文獻類型
方法
對象,具體,模型,要素,關係
全部要素,關係,具體,模型分析
內容特徵/根本依據,外表特徵/輔助依據
概念轉換
定義
以主題分析為基礎,賦予標識,結果是形成檢索標識
方法
直接轉換
分解轉換
審核
品質管制
一致性
查全率查準率
專指度
查準率
標引深度
查全率
自動標引
意義
定義
特點
分類
方法
統計分析法
詞頻分析
齊夫,盧恩(自動抽詞/去高低頻)
加權分析
逆文獻頻率
詞頻/文獻頻率/標引詞/特徵詞
詞區分度
相關性
價值測度
n-Gram分析
統計學習
定義
透過學習過程,確定標引詞與相關詞,不相關詞之間的關係,並以此為基礎確定標引值
過程
學習
集合,詞頻,促進詞/削弱詞,計算值,得出閾值
標引
語言分析法
句法
語意
人工智慧
自動分類
分類
基於詞
根據那些可以代表文章主題內容的詞彙對文章進行類別判定的一種方法
步驟
選擇分類體系,利用現有分類法、詞表、 同義辭典等工具,形成歸類底表
抽取表達主題內容的關鍵字,並將其與預先設計的「分類號關鍵字 」所形成的向量空間模型進行匹配,找出每個關鍵字涉及的分類號
把所有分類號進行邏輯運算歸併整理,結合各種複合表索引庫,依照級別,得出每個分類號的權值等級。級別最高的類,即為該文獻應歸的類
基於知識
知識庫/專家系統
聚類
網頁特徵表示
特徵抽取,特徵選擇,數學轉換
詞頻,位置
相似度計算
聚類
標引
評價
分類標引
定義
原則
規則
主題標引
定義
規則
選詞規則
組配規則
相互關係
標記語言
通用標記語言SGML
超文本標記語言HTML
可拓展的標記語言XML
MARC XML
網路資訊組織
特點
產生傳播,速度和數量,自動化
種類增多,資料庫成分複雜化,非結構化
使用者的資訊行為,非專業化,透明,易用化
訊息形式,非線性,互動動態,超文本
方法
分類法
傳統文獻分類法
嚴格等級體系
等級結構,概念體系,類目關係
自用標引,分類組織
學術性資源,圖書館資源
自編分類系統
分類
網站分類目錄
網頁分類索引
特點
以事物或主題為中心
使用者需求
主題中心類目
內容特徵,需求特徵,載具特徵體系
具有實用性,缺乏嚴密性
語詞標識
多重列累,重複反應
網狀結構
多重途徑
類目範圍
從屬
相關
更新迅速
連結
動態
主題法
敘詞
專業資料庫;獨立敘詞表/整合在資料庫中的敘詞表
概念
缺點
自動
自然
成本
關鍵字
概念
特性:不受控,受控程度較低
搜尋引擎:自動索引軟體 文獻資料庫:語詞識別系統(分類/主題瀏覽)
具體技術/方式
文件法
概念
優點
簡單方便
組織非結構化資訊的天然單位
缺點
難以平衡網路負載與文件數量
難以處理結構化資訊組織活動,邏輯結構較為簡單
在文件數量較大時 需要將文件本身作為資訊管理組織的對象
資料庫
概念
優點
規範化處理
資料管理與應用程式完全分離
多媒體資料庫,半結構化資料庫的發展
缺點
難以處理非結構化訊息
對使用者與資料庫的服務端要求較高
不能提供知識關聯,語意關聯
主題樹
概念
優點
結構清晰,簡單易用
範疇分類體系
樹型目錄結構
缺點
事先確立
結構與可用性限制
人工組織
超媒體技術
概念
優點
跳躍性思維
突破媒體類型限制
連結檢索/避免檢索語言複雜性
缺點
盲目性
定位難
記錄難
眾包
概念
外包,非特定,大眾網絡,整合
個人承擔/開源個體生產
Wiki
Tag
自由分類法
定義
特點
優點
平面化/非等級結構的類別結構
兼顧分類、主題雙重功能
動態變化/容易更新
簡單易用/自由分享/tag cloud
缺點
缺乏層次性
表達概念模糊
語意不精確
缺乏同義詞控制
不規範/無序
完善
與傳統分類法
與元資料
知識組織
概述
概念
蔣永福
主觀知識客觀化/客觀知識主體化/組織化過程
布魯克斯
知識地圖:分析相互影響與連結/標記節點/形成並展示其有機結構
基於本體的知識地圖
賽恩
思想基因演化圖譜/知識單元及其影響聯繫
特徵
知識表示
王知津
狹義:文獻整序/分類標引編目
廣義:知識兩要素(知識因子有序化/知識關聯網絡化)
主觀知識表示
邏輯標識
產生式規則
語意網路表示
框架表示
物件導向的表示法
客觀知識表示
分類標引
主題標引
原理:字典,特徵相符性比較,標識符號
區別:分類:語意 語法;主題:語法為主語意為輔
語意視角下知識表示
語意網
概念
大量機器可理解的數據
原有萬維網加入機器可理解的內容
數據及相關關係由術語表示,電腦透過屬於及其形成的關係網絡來獲取和理解數據的含義,從而進行邏輯推理,完成從前無法完成的工作
核心/組織機制
資訊描述:基於XML,RDF
語意表示:基於本體,賦予語意,實作語意互通
本體
概念
共享概念模型的明確形式化規範說明
要素:概念,屬性,公理,取值,名義
意義
特徵
內容
直接體現語意
結構
多維網狀
使用
分散式共享
邏輯推理
關聯
知識圖譜