特工每日情报丨 2025 年 3 月 27 日

date

Mar 27, 2025

slug

ai-news-2025-03-27

status

Published

产品

Ima 正式上线知识号

信源：https://mp.weixin.qq.com/s/osv2pfaGLwtHoqOOP6-Y4Q

① 知识库创作者可以在ima知识号入口申请创建账号，账号创建成功后即可在ima知识广场发布知识库。

② 知识号提供了数据分析工具，你可以直观地看到知识库的相关数据，包括知识库的数量、人数。

③ 如果知识库加入总人数大于500人，知识号还会提供单个知识库的访问次数、问答次数、数据趋势，帮助你更清晰地知道如何优化知识库的内容和问答设置。

另外此次更新 ima 可以拥有 30G 个人云存储空间

Ideogram 发布 3.0 版

信源：https://x.com/ideogram_ai/status/1904927717281456188?s=61
介绍：https://about.ideogram.ai/3.0

在专业设计师评估中，Ideogram 3.0 在各种提示词范围内始终优于其他领先的图像模型

该模型在图像-提示对齐度、照片级真实感和文本渲染质量方面实现了显著进步

在人类评估中，Ideogram 3.0 在多样化提示词集上的 ELO 评分始终优于其他文本到图像模型

核心优势

在专业设计师评估中，Ideogram 3.0 在各种提示词范围内始终优于其他领先的图像模型

该模型在图像-提示对齐度、照片级真实感和文本渲染质量方面实现了显著进步

在人类评估中，Ideogram 3.0 在多样化提示词集上的 ELO 评分始终优于其他文本到图像模型

主要功能特点

风格参考功能

创作者可以上传最多 3 张参考图片来控制生成内容，使其遵循所选的美学风格

这使创作者能够快速指定难以用文字描述的风格，实现更高效、更具表现力的创作工作流程

提供"随机风格"功能，可从 43 亿个预设中探索独特组合

用户找到喜欢的风格后，可以通过"风格代码"保存并重复使用

创意设计能力

为平面设计、广告、营销等专业用例提供突破性的文本和布局生成能力

能够以卓越的精确度创建风格化、准确的文本，包括其他模型难以处理的复杂和长篇构图

创建的文本美观且富有艺术性，远超传统设计平台中的排版能力

增强的图像质量

改进了场景细节、照明、色彩控制和手部渲染

提供先进的编辑工具，如魔法填充(Magic Fill)等功能

专注于提供照片级真实感的图像输出

可用性

现已向所有用户开放，可通过 ideogram.ai 网站和 iOS 应用使用

早期访问用户可获得 10,000 次优先生成机会

技术

阿里 Qwen Chat 上线音视频通话，并开源 Omni-7B

信源：https://x.com/alibaba_qwen/status/1904944923159445914?s=61

Qwen 2.5-Omni 是一个端到端的多模态大语言模型，旨在感知包括文本、图像、音频和视频在内的多种模态，同时以流式的方式生成文本和自然语音响应。

主要特点

全能创新架构：我们提出了一种全新的Thinker-Talker架构，这是一种端到端的多模态模型，旨在支持文本/图像/音频/视频的跨模态理解，同时以流式方式生成文本和自然语音响应。我们提出了一种新的位置编码技术，称为TMRoPE（Time-aligned Multimodal RoPE），通过时间轴对齐实现视频与音频输入的精准同步。

实时音视频交互：架构旨在支持完全实时交互，支持分块输入和即时输出。

自然流畅的语音生成：在语音生成的自然性和稳定性方面超越了许多现有的流式和非流式替代方案。

全模态性能优势：在同等规模的单模态模型进行基准测试时，表现出卓越的性能。Qwen2.5-Omni在音频能力上优于类似大小的Qwen2-Audio，并与Qwen2.5-VL-7B保持同等水平。

卓越的端到端语音指令跟随能力：Qwen2.5-Omni在端到端语音指令跟随方面表现出与文本输入处理相媲美的效果，在MMLU通用知识理解和GSM8K数学推理等基准测试中表现优异。

OpenAI Agents SDK 兼容 MCP 协议

信源：https://x.com/sama/status/1904957253456941061?s=61
OpenAI Agents SDK:https://openai.github.io/openai-agents-python/
MCP: https://modelcontextprotocol.io/introduction

OpenAI宣布开始支持MCP（模型上下文协议），该消息由CEO奥特曼亲自公布。他表示："人们非常喜欢MCP，我们也很高兴在产品中增加对它的支持。今天我们已经在Agent SDK中支持MCP，对ChatGPT桌面应用以及Responses API的支持也即将到来！"

MCP是由Anthropic于2024年底推出的一种开放协议，旨在通过标准化接口实现大语言模型与外部数据源及工具的无缝集成。它被比喻为AI应用领域的"USB-C接口"，为AI模型与不同数据源和工具之间提供了统一的连接方式。

Anthropic首席产品官Mike Krieger对此表示欢迎："很高兴看到OpenAI也开始支持MCP。从去年到现在，MCP已经成为一个蓬勃发展的开放标准，拥有数千种集成，并且还在不断增长。"

自MCP开源以来，Block、Apollo、Replit、Codeium和Sourcegraph等公司已为其平台添加了MCP支持。OpenAI表示将在未来几个月内分享更多有关MCP计划的信息。

OpenAI的这一举措将大大降低开发Agent的成本，研究者可以利用众多的MCP服务器为智能体提供丰富的工具。

投融资

Nvidia 正在谈判收购 Lepton AI 丨The Information

信源：https://www.theinformation.com/articles/nvidia-nears-deal-buy-gpu-reseller-several-hundred-million-dollars
https://x.com/theinformation/status/1904998047454560612?s=61
Lepton AI：https://www.lepton.ai/