随着大模型在社会应用中逐渐普及,人们在享受便利的同时,也面临着“AI 幻觉”产生的风险。训练数据是影响大模型“认知能力”的关键要素,近期,合合信息科TextIn“大模型加速器 2.0”版本正式上线,对复杂文档的版式、布局和元素进行精准解析及结构化处理,从数据源头降低大模型“幻觉”风险,让大模型在与人类的沟通中“更靠谱”。
大模型需要不断“吸收”正确的专业知识,才能应对实际应用问题。技术团队成员表示,在处理年报、论文、实验室报告等专业文档的过程中,一个符号的解析失误,便可能“误导”大模型,得出与事实相悖的结论。可信性的缺失,也制约了大模型在实际应用场景中的纵深拓展。
据介绍,升级后的“大模型加速器”在复杂版面理解、表格及图表处理、内容溯源等能力上实现新突破,可识别上千种文档中的跨页表格、合并单元格、密集表格、手写字符及公式,“逆还原”十余种专业图表数据,并将其转化为大模型可理解的结构化数据。
近期,多家券商机构纷纷宣布接入大模型,“大模型加速器 2.0” 上线了知识库产品组件,支持复杂文档的智能问答、总结与检索。目前,知识库组件已面向开发者开源。
