
王海峰表示,语言与知识技术是人工智能认知能力的核心。在百度语言与知识技术的布局和发展中,百度始终在注意把握两个趋势,即技术发展趋势和产业发展趋势,并力争引领趋势,从研究方法、研究对象、研究方向、产业应用等各个层面,完整布局,不断打磨成熟,始终与应用的发展趋势、需求一脉相承。

同时,王海峰展示了百度完整的语言与知识技术布局,包括知识图谱、语言理解与生成技术,以及上述技术所支持的包含智能搜索、机器翻译、对话系统、智能写作、深度问答等在内的的应用系统,并对上述技术布局逐一展开解读和分享。

知识图谱是机器认知世界的基础,王海峰透露,目前百度打造了世界上最大的多元异构知识图谱,拥有超过50亿实体和5500亿事实,并在不断演进和更新,已应用于各行各业,每日调用次数超过400亿次。
此外,王海峰介绍,在知识的加持下,语言理解相关技术的能力不断增强,机器也可以逐渐像人一样不断学习、不断进步。百度提出知识增强的语义理解框架文心(ERNIE),即在深度学习的基础上融入知识,具备人类一样的学习能力,曾一举登顶全球权威数据集GLUE榜单,首次突破90分大关,刷新榜单历史,并且超越人类得分。

同时,百度还研制了知识增强的跨模态深度语义理解方法,通过知识关联跨模态信息,运用语言描述不同模态信息的语义,进而让机器实现从“看清”到“看懂”、从“听清”到“听懂”,即图像和语言、语音和语言的一体化理解。
免责声明:本文版权归原作者所有,文章系作者个人观点不代表蜗牛派立场,如若转载请联系原作者;本站仅提供信息存储空间服务,内容仅为传递更多信息之目的,如涉及作品内容、版权等其它问题都请联系kefu@woniupai.net反馈!
]]>
百度集团副总裁吴甜
吴甜重磅推出语义理解技术与平台文心(ERNIE),意义取自《文心雕龙》。文心基于深度学习平台飞桨打造,提供的一站式能力,将减少开发者90%数据标注量、90%算力投入、85%模型开发时长,进而全面降低NLP定制开发的成本。目前,文心已经广泛用于百度产品中,累计支持业界开发者超过20000余名,应用场景覆盖金融、通信、教育、电商等各行各业,显著提升企业应用效果和效率。


百度全新发布TextMind智能文档分析平台,提供一站式企业文档规范化解析方案,促进办公智能化升级。
吴甜介绍,TextMind基于OCR和NLP技术,以文档解析为核心能力,具备文档比对、审核的能力,支持丰富的应用。它的特点可以总结为“多快好省”四个字。“多”指支持多种格式,目前可解析6种格式、20类文档;“快”指显著提高企业文档处理效率,比如,可将企业报销时间从3-5个工作日缩短至1分钟;“好”指效果好,基于TextMind预置的文档解析能力,企业开箱即用,实现零门槛定制;“省”指文档规范化解析可帮助企业降低人力成本80%以上。

此外,百度还全新发布了百度AI同传会议解决方案。据吴甜介绍,全新发布的AI同传会议解决方案,覆盖会议全场景、全流程,旨在打造用户随身的“会议同传专家”。吴甜现场展示了如何只用一台电脑和一部手机快速搭建一套同传服务,只需点点鼠标、打几个字,就能快速获得专业的同传服务。


此外,语意生成工具方面,百度大脑智能创作平台针对媒体应用场景再升级,推出智能策划、智能采编、智能审校3大媒体场景方案,助力媒体人更快、更好地进行创作。
据介绍,智能创作平台推出以来,智能创作平台已自动创作文章超过200万篇;今年4月推出的图文转视频能力,已有7000多用户,已生产短视频15万个,相当于一个人至少100年的工作量。智能创作平台已落地在人民日报、央视网等20多家媒体机构。


另外,百度全新发布了智能对话定制与服务平台UNIT重点升级了3项技术:更智能的任务式对话理解、极致便捷的表格问答和融合通用的新引擎。此次UNIT全新推出的三大能力,将进一步降低任务式对话、智能问答的定制成本,并融合通用对话能力,提升交互体验。

同时,百度联合中国计算机学会、中国中文信息学会发起中文自然语言处理数据共建计划——千言,解决数据稀缺问题。
百度技术委员会主席吴华介绍,千言一期由来自国内11家高校和企业的数据资源研发者共同建设,已涵盖开放域对话、阅读理解等7大任务,20余个中文开源数据集。未来计划在未来3年,面向20多个任务,收集和建设不少于100个中文自然语言处理数据集,覆盖语言与知识技术全部领域。
免责声明:本文版权归原作者所有,文章系作者个人观点不代表蜗牛派立场,如若转载请联系原作者;本站仅提供信息存储空间服务,内容仅为传递更多信息之目的,如涉及作品内容、版权等其它问题都请联系kefu@woniupai.net反馈!
]]>