/
/
立足岗位作贡献 | 陈运文:打造智能文本时代的通关“密匙”

立足岗位作贡献 | 陈运文:打造智能文本时代的通关“密匙”

 

 

自然语言处理、机器学习、多模态、三维重建……自去年ChatGPT横空出世以来,人工智能领域正持续快速发展,各类相关应用产业迎来前所未有的机遇。在上海浦东,一家专注于智能文本机器人的公司——达观数据于2015年正式成立,其核心技术团队由陈运文和来自腾讯、百度、盛大的十余名数据技术专家组成。“智能知识管理技术能帮助企业更有效地整合、存储和共享知识资源,加速企业智力创新。”八年来,陈运文专注于这份所热爱的事业,带领团队将智能文本处理技术推向了新高度。截至目前,达观数据已在文本挖掘、搜索引擎、个性化推荐系统方面已拥有200余项国家发明专利,在国际著名学术期刊发表有数十篇技术论文,服务企业超过1000家。

 

创新初心:“做难而正确的事”

在创业之前,作为一名IT工程师的陈运文先后在百度、盛大、腾讯从事数据挖掘相关的技术工作。复旦大学计算机系博士毕业的他,对数据算法有着先天的技术优势,同时他也敏锐地发现,文本智能处理技术的企业端应用在国内尚属真空阶段。“我在百度负责搜索引擎的算法研发工作,每到年底,我发现‘年终总结’的搜索量都飙升到百度后台搜索量的前十。”这让陈运文萌发了一个想法,能否开发一个系统,代替人来完成枯燥的文字写作工作。“科学技术在发展,但企业对文本处理的方式和几十年前的无异,依然是以传统的方式靠人去完成阅读和审核。如何让人工智能结合自动化的技术在工业界发挥价值,让企业对文本处理的流程更便捷高效,这是达观的创业初衷。”陈运文表示。

从缺资金、缺办公楼、缺客户、缺人才的初创企业,到智能文本处理领域内国家首家专精特新小巨人企业,陈运文和他的团队投入了无数的心血和研发力量,不断精进算法创新,交出了一份又一份令人欣喜的成果——2016年,首家开发IDP智能文档处理平台,原创了文档版面自动分析技术;2017年首创表智能识别功能,全面解析跨页、倾斜、无框等复杂表;2018年首创无锚点OCR解析和文字提取算法,攻克无固定格式的票据识别;2021年首家将知识图谱技术用于制造业FMEA故障定位和推导应用;2023年研发出具有长文本、多语言、垂直化三大特点的专用国产“曹植”大语言模型,并在第六届世界人工智能大会上正式对外亮相。

 

汇聚成长:“深耕之下必有回响”

从张江科学城内一间20多平方米的办公室起步,陈运文的创业经历既是创始团队深耕于NLP(自然语言处理)领域的一次开花结果,又得益于浦东对创新创业企业的支持与培育。陈运文在创业之初就选择在上海浦东软件园,享受到了园区方为企业提供的包括办公场地、投融资对接、“产学研”合作等一站式、专业化的产业生态服务。如今,达观数据已成长为园区明星企业,通过上下游产业联动,让更多企业、人才、服务在此生根发芽。2015年至今,陈运文及其团队获得了中信、招商、广发和中信建投等多家投资机构的青睐,并屡屡刷新业内融资记录。

 

如今,在达观数据的企业展厅内,挂着一整面墙的荣誉,包括国家级专精特新“小巨人”企业、中国人工智能领域最高奖“吴文俊人工智能奖”以及国内外13家机构颁发的奖项。陈运文个人也收获了国家对创业者的肯定,2020年和2021年分获共青团中央“全国向上向善好青年”创新创业好青年奖和“中国青年创业奖”,2021年获得上海市“五一劳动奖章”。

面向未来:大模型赋能百业发展

汇聚奋斗者、激励有为者,陈运文和其团队仍将在创业路上不断前行,引领国内智能文本处理技术的发展新高潮。今年8月底,为促使“曹植”大模型在各垂直领域中可以更低成本高效能地落地与应用,达观数据正式推出私有化大模型一体机,可在企业内部一键部署大模型应用,能同时为多种垂直大模型业务提供文档智能审阅、智能知识管理、知识搜索与问答、文档智能写作、智能推荐等智能化服务,帮助企业实现智能管控、降本增效。“智能化系统具有巨大发展潜力,但仍面临诸多瓶颈,比如知识流失、知识泄露等问题。”因此,陈运文提出了“留得下”、“看得见”、“用得着”、“全都有”、“强管控”五大解决方案,帮助企业打造自己专属的“知识大脑”,通过大模型充分与专业性长文本写作结合,认真打磨出针对每个企业自己的专用文本处理系统,开启企业智慧知识管理的新篇章。

随着人工智能浪潮的到来,以陈运文为代表的创业者正将先进技术与应用场景充分融合,让大模型赋能百业,让更多枯燥作业找到解决方案,但他相信,AI不代表替代人类,“人类培养自身的判断分析能力,远比信息记忆能力更重要。”

模型与算法、数据与知识、芯片与算力、场景与真实的产业应用需求,是数字生态发展的核心力量,是大模型竞争的关键因素。相信在不远的未来,陈运文和他的团队将通过持续的创新和研发,为各行各业提供更好、更快、更安全的智能化解决方案,打造智能文本时代的通关“密匙”。

推荐单位:中国信息产业商会服务外包分会

 

 

这是描述信息

地址:北京市石景山区石景山路23号院16号楼五层        电话:010-68640013、68640027         传真:010-68640013          邮箱:office@ciita.org.cn

版权所有 @1990-2021  中国信息产业商会          京ICP备14010836号          技术支持:新网