知识检索中的搜索与分类


在使用信息技术系统共享和检索知识和信息时,最重要的方面之一是能够找到您正在寻找的东西。存储在计算机、数据库、网络、云端等的数据,信息和知识越多,就越难以快速有效地找到我们所需要的东西。
XU等人(2011)指出,知识检索是当今最大的挑战之一,也是许多信息技术系统试图解决的问题。信息技术系统可以通过几种方式为信息和知识检索做出贡献,包括具有过滤选项的强大搜索功能和智能搜索工具。
信息系统可以具有任意数量的特征。这些可能包括跨不同类型媒体的搜索,查询辅助,排序,过滤,支持不同索引方法,按关键字搜索或按相关性搜索,支持不同语言等。知识和信息检索中使用的技术范围从简单的关键字索引/搜索到高级算法和神经模型。
Babu等人(2012)确定了信息检索过程中的几个一般步骤:
1. 索引:这里索引器必须“萃取”文档的内容,可以通过复杂的过程自动完成,提取关键信息——超越简单的文本,可以包括图像、声音等——或者由用户手动完成(可能包括用户指定的关键字、描述、摘要等)。
2. 查询表述:“查询描述被手动或自动地转换成正式的查询表示形式……”“……它结合了预测文档有用性的特性。该查询根据系统的概念模式表达信息需求,准备与文档表示匹配”Babu 等人(2012)
3. 选择:这是结果呈现给用户的地方,通过某种形式的排名,分组等。用户选择他们需要的结果,参与改进搜索系统。例如,事件反馈被认为是改进选择的重要工具。例如,Hofmann等人(2015)描述了用于评估在线用户相关性的不同度量,将它们分组为文档级、结果列表级和会话级度量标准。
因此,信息和知识检索系统可以是通过知识和信息储存库(例如搜索引擎,专用检索软件,数字图书馆等)进行检索的独立系统,也可以被内置到内部网系统、文件检索系统、内容管理系统等中。它们的特征既取决于它们打算执行的检索类型,以便为用户提供对知识和信息存储库的最高效和有效的搜索。
提交反馈