金山办公×火山引擎:原生 Office 办公智能体「WPS 灵犀」来了!

摘要

近日,金山办公发布了 WPS AI 3.0——原生 Office 办公智能体「WPS 灵犀」,它与 WPS Office 深度协同,在部分组件中形成左侧 Office 套件、右侧「WPS 灵犀」的同屏交互形态,助力每位用户实现 AI 办公生产力的全新飞跃。

近日,金山办公发布了 WPS AI 3.0——原生 Office 办公智能体「WPS 灵犀」,它与 WPS Office 深度协同,在部分组件中形成左侧 Office 套件、右侧「WPS 灵犀」的同屏交互形态,助力每位用户实现 AI 办公生产力的全新飞跃。

目前,「WPS 灵犀」已接入多款豆包大模型和火山引擎联网问答 Agent,可以交付跨场景、端到端的任务。

用户只需通过自然语言与「WPS 灵犀」对话即可完成文档创作、演示文稿生成等功能,全程无需复杂操作和外部跳转。「WPS 灵犀」具备多轮对话、修改可控、格式保留等优势,是真正可用可控的 AI 助手。

「WPS AI 3.0 的发布预示着办公 AI 的能力已从工具升级为个人助理。我们希望 WPS 用户都能拥有好用的 AI 助理,以低使用门槛的人机交互模式,轻松地完成各项工作。」金山办公 助理总裁田然表示。

今天起 Call「灵犀语音助手」,可以喊话 WPS 给你干活了!

升级后的 WPS AI 3.0,首先体现在语音交互上。现在,当用户不方便看文档时,给「灵犀语音助手」打个电话,就可以快速获取想要的关键信息。

「灵犀语音助手」可以围绕指定文档,快速抓取内容,给出「仔细思考」后的回答。聊天结束后,助手还可以自动总结本次聊天内容,为用户生成一份可编辑的文档,方便后续回顾。

流畅自然的语音交互背后,「灵犀语音助手」依托火山引擎 RTC 实时音视频技术对语音的高效采集与稳定传输,端到端延迟可以低至 1s

同时,通过豆包·语音识别模型的精准语音识别和豆包·语音合成模型的自然保真的文本转语音技术,「灵犀语音助手」能带来更具情感力的「真人助手」般对话体验。值得注意的是,火山引擎的智能音视频处理模块能够消除回声、抑制噪声,让复杂环境下语音识别依然准确。

通过上述火山引擎整体语音解决方案,灵犀语音助手让用户兼顾「文档创作」与「AI 助理」的同屏协作形态,对话式调整内容,创作如聊天般轻松。

WPS 灵犀:豆包大模型驱动,多场景助力 AI 办公新体验

「WPS 灵犀」可以依托大模型等 AI 能力,完成跨文字、表格、幻灯片等形式的理解与任务处理,完成搜索、阅读、写作、图像生成、数据分析等众多场景任务。

豆包大模型作为「WPS 灵犀」背后的核心交互处理引擎之一,可以准确理解用户意图并生成高质量、上下文连贯的回复,不仅「听得懂」,更「答得准」。其中,豆包大模型 1.6 和豆包·视觉理解模型,可以帮助其高效理解文本、图片、视频等资料。同时,当用户通过自然语言与「WPS 灵犀」交流,豆包大模型在意图理解和指令遵循上能够有效拆解用户需求,结合「WPS 灵犀」本身的工程优化,有效实现内容的快速总结和核心信息获取。

在 Deep Research 场景中,「WPS 灵犀」利用火山引擎联网问答 Agent,对互联网公域及抖音内容生态进行高效整合与筛选,通过与权威信源的深度合作,进一步提升内容匹配度,保障搜索结果的专业性、时效性。例如,用户在撰写报告或制定方案时需要资料支持结论,即可通过「WPS 灵犀」高效获取精准资料,省去繁琐查找与比对过程。

除了搜索服务以外,Deep Research 还依托豆包大模型 1.6 支持的自主思考模式,能够根据用户需求的复杂度和上下文,形成判断、并且进一步做出任务规划。在任务执行过程中,也能够通过 Function Call 自动识别并且调用后端接口来实现文字、表格、演示、PDF 的组件中的不同操作,最终实现思考过程的完整执行,形成特定结构下的高质量内容创作。

另外,在 PPT 创作场景中,「WPS 灵犀」不仅通过豆包大模型 1.6 等模型能够快速理解和创作文字内容,也结合了 WPS 在 PPT 编辑组件上多年的积累,有效把对应的文字内容填入到合适的位置;同时结合火山引擎提供的搜图、文生图 Seedream 3.0 以及图片编辑 SeedEdit 3.0 能力,为用户提供与文字内容相关的配图,快速解决用户创作过程中需要二次找图的麻烦。

为提升办公生产力,金山办公联合火山引擎携手探索 AI 与用户协作的最佳实践。未来,双方将不断拓展大模型在办公场景中的应用场景,为全球用户提供简单、高效、可控的办公体验。

来源:互联网

最新文章

极客公园

用极客视角,追踪你不可错过的科技圈.

极客之选

新鲜、有趣的硬件产品,第一时间为你呈现。

张鹏科技商业观察

聊科技,谈商业。