一、AI 能力积淀已久,2023年或将重点发力

AI 积淀已久,自2017年起即被提升至战略地位。

1)2016年,AlphaGo 掀起 AI 浪潮,金山办公紧随其后加速布局;2017年,在公司内部 AI 被上升到战略地位,AI 中台由此成立;2018年,金山办公确立“多屏、云、AI 和内容”四大战略;2020年,智能办公已见雏形,现已开发近 100 项 AI 办公能力,涵盖全文翻译、文档校对、智能写作、PPT 美化、数据分析等,落地超过 18 项 AI 应用,斩获 5 项国际 AI 技术大奖。

2)我们认为,凭借研发实力、用户积淀和办公 Know-How,AI 已成金山办公业绩增长的重要加速器。

副总裁姚冬牵头组建,AI 团队已逾百人。

1)根据 Info 报道,2017 年 5 月,暂离金山十余年的老将姚冬重回老东家,担任金山办公副总裁。姚冬自 1998 年加入金山,此前曾负责过金山词霸、金山游侠等产品。

此番重回金山,姚冬转型做 AI 方向的算法和工程产品,负责算法改进、推动工程落地、人才梯队建设工作,牵头组建了金山办公的 AI 算法、工程和产品团队。

2)截至 2022 年 11 月,金山办公的 AI 团队约有百人规模,划分为基础设施、平台、产品和应用、基础算法等小组。

成立 5 年来,AI 团队在每一阶段侧重不同的目标,分“三步走”战略。前两年,团队更强调积累 AI 研发能力,包括算法能力,工程能力,数据采集,数据分析能力等。

后两年更注重将技术产品化,关注 AI 产品能力。

研发力度高,约 3 亿募投资金用于办公 AI 项目、计划 4 年完成。

1)2019 年 11 月,公 司发布招股说明书,募投项目中办公领域人工智能基础研发中心建设占据 16%,总投资 额约 3.19 亿元。

2)办公领域人工智能基础研发中心建设方向的建设目标是利用办公领域的人工智能基础技术,提升 WPS Office 软件对自然语言和图像文字信息等内容的理解及处理能力,实现提升用户处理文件的速度与效率。

主要发力:基于海量语料的人机协同辅助写作系统研发项目、AI 自然语言处理平台项目、AI 计算机视觉识别平台项目。

海量用户、多样场景,为 AI 提供丰厚的生长土壤。

1)截至 2022 年 9 月,公司主要产品月活设备数达到 5.78 亿,延续稳定增长。这一方面为公司积累了丰富的使用场景,另一方面也为 AI 技术的迭代更新提供了数据经验基础。

2)同时,依托在办公领域 30 多年的研发经验,公司从 PC 走向移动并走向云,亦在住宿及餐饮业、制造业、建筑行业、教育行业、零售行业等积累了对应的行业 Knowhow,具备强落地能力。

多项能力已处于国内第一梯队,致力于重塑智能办公。

1)截至 2021 年 7 月,公司自主研发的OCR和机器翻译技术达到了国内第一梯队的水平,智能校对月校对字数超70亿;智能生成的内容占据整体内容资源比例为 33.6%,智能美化功能月度活跃用户数量超百万;AI 中台还打造了基于分布式训练的 AI 训练平台,包含了训练数据处理、训练调度、服务监控告警、链路追踪等一站式平台。

2)根据副总裁姚冬表示,公司 AI 三大发展战略:第一,围绕文字智能处理,提升办公效率;第二,基于认知智能的知识服务;第三,助力企业数字化转型。

2023 年将重点在 AI 领域发力,聚焦赋能企业数字化转型。

1)3 月 14 日,根据新华网报道,科技创新是企业的命脉,更关乎国家战略发展。金山办公 CEO 章庆元在接受记者采访时表示,“金山办公是科技自立自强的受益者与践行者,自成立至今 35 年来,坚持自主创新,解决‘卡脖子’问题,打造出我们自己的民族办公软件品牌”。

2)同时,“大力发展数字经济”的政策利好将为金山办公的发展带来重要机遇。章庆元介绍,金山办公今年的核心战略目标是持续赋能企业数字化转型,将重点在 AI 领域发力,尤其是在 AIGC(人工智能生成内容)方面实现更多技术应用突破,帮助客户更好地实现数字化转 型。

二、文字、图像、语音三大技术协同发展,重塑智能办公

2.1 文字:自然语言处理加速落地,文档智能表现出众

智能文档处理空间广阔,NLP 加速落地办公领域。

自然语言处理技术迭代升级,在商业领域具备丰富的落地场景,并通过与知识图谱、计算机视觉的技术融合,在文档处理等办公场景发挥重要作用。

文档智能通过对数据的深度挖掘,在人工信息审核、翻译、智能写作上表现出众。根据 KBV Research 预测,全球智能文档处理市场规模预计在 2027 年将达到 41 亿美元,企业内部文档数据难题得到有效环节,智能化办公发展加速。

WPS 布局前瞻,NLP 等现有成果已包括机器翻译、文档校对、辅助写作:

1、机器翻译:多语种翻译能力增强,结合 CV 技术做好格式处理。

AI 技术应用后翻译效果显著提升,结合 CV 的版式分析优势,机器翻译保证格式、对齐、风格保持一致。借助 WPS、稻壳网等产品生态,公司之前的金山智能翻译可以实现文本、文档及多个领域的翻译,并可以进行译后编辑。

同时,金山办公发布的蒙文版 WPS Office 2021,搭载了 AI 产品加载项技术,其中机器翻译转化率超 90%。

2、文档校对:结合丰富的语料库,黑马校对 V30 保证高效。

1)在日常办公中,错别字问题屡现,文档校对功能可以在极短时间内找到大部分错别字,并实现分词、文档分类、识别、提取校对、列示错误给予修改意见等功能。

2)据 36 氪,2021 年金山办公全资收购黑马飞腾及其黑马校对相关产品,2022 年 9 月金山办公旗下黑马校对 V30 版本正式上线,V30 版本分析上万亿汉字的语料,拥有约 8000 万条汉语知识的数据库和约 800 万条错误规则的数据库,应用于政府及企事业的公文校对和新闻出版行业的质量把关,并嵌入企业业务系统。

3、辅助写作:公文辅助已有探索,持续 2 年半投入智能写作研发。

1)2018 年 6 月,金山办公成为中国智能写作产业联盟理事长单位,该项目入选“2018 年人工智能与实体经济深度融合创新项目”,现已推出公文智能(辅助)写作、WPS 智能写作功能。

2)公文智能(辅助)写作帮助用户按照 GB/T 9704-2012 规范性要求进行排版,内置 19 个公文模板和 15 种法定公文文种,促进协作效率并避免不同软硬件环境下的错版和跑版情 况。

3)辅助写作产品积累多个提纲库和语料库,数据均源于权威媒体和政府公开网络,支持文本自动生成、辅助成稿、句子智能补写和文本智能校对等多种功能,除此之外,机器自主学习可以结合用户的行为数据和反馈,判断写作偏好。

2.2 图像:OCR 积累已久,复杂场景、美化功能逐步叠加

CV 多场景应用广泛,OCR 作为底层通用能力商业价值已现。计算机视觉是通过深度学习算法,使得计算机理解数字图像及视频,并从多模态数据中提取目标信息的能力。

OCR 技术作为 CV 的底层通用技术,是最具落地应用价值的 AI 技术之一,在智慧办公、智慧教育、智慧金融、智慧交通、智慧城市、智慧旅游等多个垂直行业中产生巨大商业价值。

目前金山办公已探索文字识别技术在多个复杂场景下的应用,并发展计算机视觉技术,实现文档矫正、智能抠图、字体识别、表格还原、版式还原、PDF 编辑等多元功能。

计算机视觉积淀深厚,现有成果包括 OCR、版式还原及图像识别。

1、OCR:抽取-筛选-整理-汇集,支撑多环境部署,实现文档结构化理解。随着 OCR 技术在移动端的运用频率增强,金山办公 OCR 技术迭代升级,除了理解中英文、简繁体等多元文字信息,还可以理解文字背后的语义和结构化信息。

1)在 CSIG 图像图形技术挑战赛中,金山在“中英文购物小票信息理解”中,通过算法对 OCR 文字框和文字抽取、筛选,并理解中英文信息实现整理和汇集,取得单项赛道冠军及总决赛双冠军。

2)在部署环境上,金山办公 OCR 支持服务端的高精度模型部署和支持手机、PC 端的小模型部署,且 2019 年,OCR 模型在移动端推理模型体积不足 10M,准确度仅比服务端下落 2%。

2、版式还原系统:矫正-识别-分析-重建,还原多种复杂场景。

版式还原是指将复杂的图片型文档解析为可编辑的文档,帮助用户在复杂场景下对不可编辑文档进行再编辑;且金山将文档扫描、文档转换、提取编辑集成为系统,满足复杂需求下的复用性。该项技术目前在业内领先,公司集成 30 个深度学习模型、100+算法模块、50+万行代码,实现弯曲矫正、污染光线、带印章&签名、没有表格线等复杂场景版式还原。

3、图像增强及智能排版:公司已可以借助算法实现文字风格的精准还原(对文字颜色、字体、加粗、斜体、下划线等格式进行高度识别),及文件的格式美化和智能排版。

目前金山办公已将 CV 技术应用于智能抠图、证件照制作、文档质量提升、滤镜、水印涂抹等众多产品功能。

与此同时,金山办公投资创客贴在线设计平台(持股 12.79%),该平台可以借助 AI 智能实现智能抠图和图文生成视频的功能,显著提高设计人员和文职人员的工作效率。

2.3 语音:语音转化丰富办公场景,打造多层次办公体验

语音转化功能打破语言边界,实现高效便捷办公。

金山办公在办公场景下的文字语音转换功能也有丰富落地场景,其中,语音交互技术可实现 36 种语言转换,实现文字到语音的快速转化和阅读;另一方面,公司还实现语言速记,在移动端和 PC 端均可适用;除此之外,审阅功能也新增语音批注,用语音实现资料查找和内容输入,显著提升办公审核便捷度。

2.4 AI 中台:推出 KSAI-Lite 开源框架,通用、高性能、轻量和专业

AI 中台能力输出,推出 KASI-Lite 深度学习推理框架。

公司 2017 年搭建内部平台,通过长期持续的技术投入,2021 年实现对外技术输出。2021 年 7 月 22 日,金山办公发布 KSAI-lite 开源框架,该框架免费开源,不仅自适应国内外主流软硬件平台及国产信创环境,并对性能、功耗、内存做了优化,为 OCR、机器翻译、智能校对等场景提供技术支持。

KSAI-Lite 框架集成多种 AI 功能,可适宜多设备离线计算场景。开源框架借助 TensorFlow 和 TensorFlow Lite 在框架层的算法优化能力,提供 AI 在单机、手机、PC 等设备的离线计算,适应隐私数据在客户端处理、算法执行快且实时等场景,目前金山办公的技术积累已覆盖所有操作系统、设备与指令集。

物体边缘检测:金山 WPS 设计的 CNN 文档检测网络,可以让安卓版用户快速检测结果,自动判断边缘并调整滤镜;

自动识别图片类型:金山 WPS 利用 TensorFlowLite 实现了能够自动识别图片类型 的 OCR 模型,提供对应的滤镜和 OCR 输出格式;

扫描件 OCR:采用 TensorFlow 部署模型,可以对文档实现旋转矫正、文本行检测等操作,节省大量文档编辑时间;

自然场景 OCR:利用 TensorFlowLite 将自然场景 OCR 运行在手机上,使它能在短时间内从复杂场景中准确定位文字并获得理想的识别结果;

图片转文档的布局分析:金山 WPS 结合 TensorFlow 与 scikit-learn 框架一起进行图文布局分析算法,大幅度降低了算法的研发成本。

同步发布 KSAI OCR 开源模型,可实现轻量化部署。

2021 年金山办公技术开放日上,金山办公当天还同步发布了 KSAI OCR 开源模型。

OCR 模型以及库文件大小不超过 9MB,可轻量化部署,该模型在文本检测、文本分类和文本识别上都表现出了较好的性能,OCR 的本质是将照片转换为机器编码的文本。

目前,OCR 技术已经在市场上逐渐普及,成为文档信息录入方式的重要补充。

KSAI-Lite 框架已上线主流开源社区,预计为公司主流产品及业界提供坚实支持。根据金山办公官方微信公众号,金山办公副总裁、AI 中台负责人姚冬表示,截至 2021 年,KSAI-lite 框架已经上架主流开源社区 GitHub。

未来 KSAI-lite 还会在更丰富的平台适配能力、更个性的开发方式、更稳定的业务支持能力上持续发力,为金山办公下主流产品和业界提供坚实的 AI 支持。

三、迈入认知智能新纪元,AIGC 吸引海外巨头持续入场

从感知走向认知,“算力+算法+数据”,知识成为 AI 发展第四极。

1)感知体系可以识别数字信息和物理世界,认知体系在此基础上更进一步,实现对感知结果的归纳、推理、演绎、决策、反馈、溯因。从办公场景来看,只有“认知智能”才能实现对发票格式、语义及零碎信息的挖掘,智能理解发票类型、报销风险、是否合规等问题。

2)人工智能的未来从简单的信息读取走向信息理解,除了算法、算力和数据的助力,需要把先验知识融入算法模型,除了通识教育的预训练,还需要业内专家进行精调整,达到更为专业的训练成果。

微软计划整合 OpenAI 工具进入旗下全线产品。

2023/01/23,微软公司通过官方博客宣布扩大与 OpenAI 的合作伙伴关系,将向 OpenAI 进行一项为期多年、价值数十亿美元的投资,以助力其在 AI 领域的技术突破。

2023/01/17,微软 CEO 纳德拉在达沃斯世界经济论坛上表示,下一阶段微软将专注于将各类工具加速推向市场,实现 OpenAI 的工具商业化,公司计划将包括 ChatGPT、DALL-E 等人工智能工具整合进微软旗下的全线产品中,包括 Bing 搜索引擎、Office 全家桶、Azure 云服务等。

AI 办公或是生成式人工智能首批落地的领域之一。

据机器之心消息:3 月 7 日,微软宣布将 ChatGPT 的技术扩展到其 PowerPlatform 平台上,这将允许用户在很少甚至不需要编写代码的情况下,就能开发自己的应用程序。

另外微软将于 3 月 16 日举办一场名为 “The Future of Work with AI”的在线活动,首席执行官纳德拉或将展示类似 ChatGPT 的人工智能如何在 Teams、Word 和 Outlook 等 Office 生产力套件中发挥作用。

我们认为,凭借扎实的研发实力、海量的用户及场景积淀、深厚的办公 Know-How,AI 有望成金山办公业绩增长的重要加速器。

风险提示

云服务推进不及预期。当前云计算在我国处于快速渗透期,若下游客户对云服务的接受程度暂缓,可能会影响公司业务推进。

国有单位 IT 支出不及预期。信创与政策、预算等因素相关性较大,若党政、行业类 IT 支出不及预期,短期内或对公司业务产生波动影响。

人员增速超预期。软件类企业的重要资产为企业员工,其工资支出、奖金福利、补贴等占据企业成本的重要部分,若人员增速高速提升,短期内或对公司利润释放造成影响。

宏观经济风险。宏观经济的影响因素较多,或对公司业务推进产生影响。

– End –

|本文内容来源:国盛证券 / 刘高畅 杨然声明

本文仅代表作者个人观点,不代表本公众号立场。本公众号转载此文仅出于传播更多资讯之目的。如有侵权或违规请及时联系我们,我们将立刻予以删除。本公众号所载文章、数据仅供参考,使用前请核实,风险自负。投资有风险,入市需谨慎。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注