计算机科学与信息技术是当今人工智能技术发展的基石。目前,计算机体系结构依然是基于冯·诺依曼设计原理,其处理信息的指令和数据均以二进制形式存储,“存储程序”和“程序控制”结合的原理,程序和数据都放在内存中,在程序的控制下自动完成。因此,由计算机处理的一切对象是符号化和数字化。
李彦廷博士的主要研究包括但不局限于以下方面:信息源理论和信息获取方法,信息的传输、存储、检索、转化和处理,信号的测量、分析、处理及显示、模式信息处理,研究对文字、声音、图像等信息的处理、分类和识别、图像识别系统,知识信息处理、研究知识的表示、获取和应用,建立具有推理和自动解决问题能力的知识信息处理系统。李彦廷博士对计算机信息的采集、分析、处理、识别和理解的基础上做出判断、决策或控制,从而建立各种控制系统、管理信息系统和决策支持系统。
作为我国计算机科学与信息技术领域的杰出人才,李彦廷博士凭借在计算机科学与信息技术领域的多年钻研和对计算机科学领域发展的深刻洞见,自主研发了“基于模糊检索与依存关系分析的文本数据分析软件V1.0”软件。“基于模糊检索与依存关系分析原理的文本数据分析软件V1.0”是一款轻便易用的文本数据分析软件,其核心算法 key-sentences extraction algorithm 的设计思想是基于离散数学的图论原理。有别于 TF-IDF 算法与 n-gram 算法,该文本数据分析软件的算法主要分三个步骤完成文本数据分析。
李彦廷博士了解到,语言作为人类的沟通交流工具,自然语言中包括了多种属性的词语,例如形容词、副词、 介词、动词等。因此,在该软件中,Key-sentences extraction algorithm 先将文本中无意义的单词过滤掉,进行文本预处理。与此同时,该软件会保留有意义的、可以用于描述文本概要(abstraction or summarization)的单词。然后,根据计算文本中保留下来的所有单词的出现频率,软降系统会将出现频率高(high-Freq word)的单词作为关键词(keywords)保留在文档中,而将出现频率低(low-Freq word)的单词进行删除。当软件系统把单词的出现频率都计算出结果后,就会对单词与单词之间的共起关系(co-occurrence frequency)进行计算。在这一处理步骤中,软件对一对单词(word pair)产生重要约束,即每一组单词对中的两个单词的距离必须最短(参考最短距离法)。
根据图论原理(graph theory),“基于模糊检索与依存关系分析原理的文本数据分析软件V1.0”会计算出使用频率高的单词周围会有多少与该单词存在相互关联的关系。在最后一个步骤,该软件系统则会提取出文档中的所有高使用频率的单词。如果在文档中,一个单词与这一对单词中的任意一个单词都有关联的话,软件系统会将这三个单词形成一个三角形关系,并被作为关键句(key sentence)提取出来。最终,所有被提取出来的关键句子会被用于概括文档的主旨或者概要。李彦廷博士表示,“基于模糊检索与依存关系分析的文本数据分析软件V1.0”是自然语言处理技术中的其中一个重要应用分支,也是近年人工智能技术中重要的研究方向。该软件有着广泛的应用场景,例如人机对话系统、网络文本要约系统、网络舆论情报收集等场景都可以使用该软件。
“基于模糊检索与依存关系分析的文本数据分析软件V1.0”极大体现了计算机科学与信息技术在自然语言处理领域的应用价值,并灵活拓展了计算机信息技术的应用场景,发挥了卓越的技术优势。这也进一步为计算机信息领域发展提供重要示范。凭借开放创新和坚持拼搏的研发精神,李彦廷博士为该项计算机信息技术软件赋予了优秀杰出的技术优势。这项技术成果吸引了计算机信息领域内的众多知名和极具影响力的公司,并与李彦廷博士达成技术合作关系。
最终,李彦廷博士与多个业内知名公司达成合作。而该项合作使多个公司在计算机信息领域中获得重大突破,极大提高了它们的技术创新与开发能力。该软件以计算机技术解决了单词中的准确率与词语使用错误的问题,极大地提高了自然语言使用的准确性。与此同时,该项软件系统在计算机分析自然语言的关键步骤中提供更全面和更精准的过滤与分析,实现自然语言处理技术中的智能化和信息化。据相关技术人员反馈,“基于模糊检索与依存关系分析的文本数据分析软件V1.0”为使用者提供了更加准确与高效的自然语言单词使用的效果,打破了原有的单词软件在体验感上的不足。最终,该软件系统的上市就得到了广大使用者的一致好评,也得到了计算机信息领域专家的高度赞赏与认可。与此同时,凭借在产品开发和优化项目中充分利用基于模糊检索与依存关系分析的文本数据分析软件V1.0”的技术优势,众多业内知名企业打造出了多个瞩目的计算机技术产品,进一步提高了其在业内的知名度,巩固了在该领域极具影响力和权威性的领军地位。
李彦廷博士表示计算机信息技术主要朝着三个方向发展:一是向“快”的方向,速度越来越快性能越来越高,计算机的数据处理频率也会越来越快;二是向“广”度方向发展,计算机发展的趋势无处不在,应用范围更加广泛;三是向“深”度方向发展,即向信息处理的智能化发展。在未来,作为我国计算机科学与信息技术研究领域内研发经验丰富的技术专家,李彦廷博士将会不断提高计算机信息技术的水平,推动我国的计算机科学与信息技术研究领域的发展建设,以满足国家建设和社会发展需要。(文/邓清为)
(来源:新视线)