图:合合信息文档解析技术精准实现跨页段落合并
在完成文档解析后,企业还需将内容翻译成当地语言版本用于医械产品上市注册审批,翻译前的信息提取精度直接影响了翻译精度。文档解析技术能够保持段落、表格等原始结构,减少翻译后重排工作,同时支持批量、高效提取五十多种语言文档内的信息,可精确定位至某页某行某个具体单词,提升翻译后的文档一致性。
AI助力制造业规避侵权风险
制造业作为出海“老牌”行业,正在向具有高附加值的先进制造业转型,在此过程中,知识产权纠纷也成为了容易触发争议的领域之一。《中国专利调查报告》显示,2023 年计算机、通信和其他电子设备制造业企业遭遇海外知识产权纠纷比例最高,影响企业海外发展前景。
对此,企业需要做好侵权风险分析,打造企业专利信息库,定期检索与本产品及技术密切相关的专利说明书、科研论文、国际标准等内容。在专利库搭建过程中,除了文本、表格和流程图外,数学公式也是材料中常见的元素,以其复杂的结构成为文档解析过程中的“拦路虎”。
过去工作人员需要经过数道繁杂程序对公式进行查找、辨认和手工录入,耗费时间长。文档解析技术可单独对公式类内容进行批量提取,支持识别Latex公式并导出为MathML Code等多种格式。为了进一步提高数据精度,用户可直接在界面上修改、编辑公式,方便后续数据应用。
图:合合信息文档解析技术批量识别公式
何禾 小风
校对 陶善工
编辑 : 徐晓风
更多内容请打开紫牛新闻, 或点击链接