3月28日消息,钉钉 助理升级,上线图片理解、文档速读、工作流等产品能力,探索多模态、长文本与 rpa 技术在 ai 应用的落地。
据悉,基于阿里通义千问大模型,升级后的钉钉 ai 助理拥有更强的视觉推理能力和长文本速读能力。目前,用户在钉钉 im 消息框或点击魔法棒按钮进入 ai 助理对话框,发送长文件、在线文档、网页链接、视频内容,即可根据内容识人、识地点、分析、答题、翻译、摘要、提取文字,甚至可以通过多轮交互进一步做智能问答。
比如,基于通义千问大模型,钉钉 ai 助理可以快速阅读本地文件如 word、pdf、ppt、excel 等、钉钉文档、网页链接等多种格式文件,轻松解析各类学术论文、产品手册、使用教程、数据表格、新闻报道、多国语言的图书等。
还值得关注的是,在工作流方面,这是 ai agent 的进阶,可以在创建时对 ai 执行任务的流程进行拆解和编排,使得 ai 助理可以主动接管完成相应操作,还能够打通外部的系统数据和 api 能力,进一步扩展了它的行动能力,比如搭建能自动写脚本并生成视频的创作 ai 助理。
(本文来源zaker,如有侵权请联系删除)