构建智能校验系统,人工智能让中国大百科全书出版社内容生产更安全

项目背景

中国大百科全书出版社于1978年成立,是以出版百科全书和其他工具书为主,同时出版各种学术著作和普及读物的国家级大型出版社。百分点为其搭建百科数据处理系统,通过文本分析、自然语义分析、机器学习、人工干预等技术与方式,对海量百科数据进行处理,进而形成一系列知识成果,并在百科智能知识系统的基础上辅助编辑人员对专有名词和知识点进行校验,并逐步实现对句子的自动校验。


78b2260e2db505bd4f848542ea51d92.png


项目内容

智能分词与词库管理

对百科条目进行文本分析,实现分词、词性识别、名词分类、变形词识别、词频统计等分析处理,同时提供分词管理、词性管理、学科管理、变形词管理、热词分析等。完善词条的分词、知识点、词典的任务分配和审批流程,避免任务的重复分配,减少人工分析处理的投入成本,极大提高编辑人员的工作效率。

建立智能知识系统

通过智能知识系统的建设,在完成前期精准分词与标引的基础上,实现对已有知识点的识别,并能根据分词结果及当前词条的上下文语义,自动识别出知识点并创建索引。在此基础上,为编辑提供百科知识库和百科知识词典检索服务,辅助编辑日常工作。

建立智能校验系统

通过智能校验系统的建设,支持对内容关联准确性的校验,辅助编辑人员对提交的文本内容进行专有名词校验和比对,提示文本内容中是否有新词,判断是否包含知识库中已有的知识点,逐步实现对错误词及句子的校验。