站长之家 - 原创 2025-03-07 15:29

AI日报:X官方账号被冻结!Manus平替开源版来袭;腾讯混元图生视频模型开源;Mistral AI推世界OCR

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解:https://top.aibase.com/

1、三小时复刻Manus!OpenManus横空出世,斩获GitHub3000+星标

OpenManus项目在短短三小时内复刻了Manus智能体,并迅速在GitHub上获得了超过3300个星标。该项目的安装过程简单易行,仅需修改配置文件即可使用。OpenManus集成了多个顶级大模型,展现出强大的任务处理能力,能够将复杂任务分解为清晰步骤,生成详尽报告。

【AiBase提要:】

✨ OpenManus在三小时内复刻了Manus智能体,迅速获得3300+星标。

🛠️ 安装过程简单,只需修改config.toml即可开始使用。

🤖 集成多个顶级大模型,展现出强大的任务处理能力,能够生成详尽的SEO优化报告。

详情链接:https://github.com/mannaandpoem/OpenManus

2、别抢Manus邀请码了!CAMEL-AI0天复刻Manus通用智能体OWL震撼登场

CAMEL-AI团队推出的OWL项目为开源社区带来了新的希望,凭借其在GAIA基准测试中取得的优异成绩,OWL成为开源框架的佼佼者。与Manus相比,OWL不仅完全开源,还提供了灵活高效的多智能体协作能力和强大的任务自动化功能。

image.png

【AiBase提要:】

🌟 OWL在GAIA基准测试中取得58.18的高分,成为开源框架榜首,超越Huggingface的Open Deep Research。

🔧 OWL完全开源,开发者可在GitHub上clone代码,参与框架建设,体验强大的多智能体协作能力。

📈 CAMEL-AI团队积极规划未来,包括撰写技术博客和增强工具生态,致力于复刻并超越Manus的功能。

详情链接:https://github.com/camel-ai/owl

3、阿里通义千问推理大模型QwQ-32B勇夺全球开源社区榜首

阿里巴巴推出的QwQ-32B推理模型在HuggingFace的榜单上夺得第一名,展现出卓越的性能,超越了多款知名模型如微软的Phi-4和DeepSeek-R1。该模型在数学、代码处理等方面表现出色,且由于其较小的参数量,能够在消费级显卡上实现本地部署,降低了应用成本。

image.png

【AiBase提要:】

🌟 QwQ-32B模型在HuggingFace榜单上位居第一,超越多个知名模型。

💡 该模型在性能与应用成本上实现突破,支持消费级显卡的本地部署。

📈 多项基准测试中表现优异,与最强模型DeepSeek-R1相媲美。

4、腾讯混元发布图生视频模型HunyuanVideo-I2V,并上线对口型等玩法

腾讯近日开源了其新研发的图像转视频生成框架HunyuanVideo-I2V,旨在推动开放源代码社区的探索。该模型能够将静态图像转换为动态视频,用户只需上传图片并描述动态效果,即可生成生动的短视频。HunyuanVideo-I2V结合了多模态大语言模型,增强了对图像语义的理解。

image.png

【AiBase提要:】

🖼️ HunyuanVideo-I2V允许用户将静态图像转换为生动的视频,用户只需上传图片并描述动态效果。

🎶 模型能够自动配上背景音效,增强视频的趣味性和吸引力,同时支持对口型功能,让人物“说话”或“唱歌”。

🌐 开源内容包括模型权重和推理代码,开发者可在GitHub和HuggingFace下载,已有900多个衍生版本。

详情链接:https://video.hunyuan.tencent.com/

github:https://github.com/Tencent/HunyuanVideo-I2V

5、号称全球性能最高!Mistral 发布全新 OCR API 全方位解析文档

Mistral推出的OCR API,Mistral OCR,旨在提升企业文档理解能力,能够精准提取各种文档中的信息并整理为结构化数据。它支持多语言和多模态处理,保留文档格式,提供自托管选项,并与大型语言模型集成,极大地提升了文档处理的速度和准确性。对于面临非结构化数据挑战的企业而言,Mistral OCR无疑是一项革命性的技术,助力企业实现数字化转型。

image.png

【AiBase提要:】

📝 Mistral OCR支持多种语言和文档格式,能够精准提取手写、打印文本及复杂图表,提升文档处理能力。

🔒 提供本地部署选项,满足企业对数据安全和合规性的严格要求,确保敏感信息的安全处理。

⚡ Mistral OCR在性能上表现优越,处理速度可达每分钟2000页,显著提高文档处理效率。

详情链接:https://mistral.ai/news/mistral-ocr

6、出门问问发布TicVoice7.0支持超自然语音克隆与跨语种生成能力

出门问问与多所顶尖高校合作,推出了新一代语音生成模型TicVoice7.0,标志着语音生成技术的重大突破。该引擎采用创新的BiCodec编码技术,显著提升了语音克隆能力和情感表现力,用户可通过个性化定制获得专业级的语音体验。

image.png

【AiBase提要:】

🎤 TicVoice7.0采用BiCodec编码技术,实现语音token与文本token的高度统一,提升生成效率与可控性。

🌟 该引擎在音色相似度和情感表现力上显著提升,国际通用MOS评分从3.9提升至4.2,提供更自然的听感体验。

📈 用户可通过调整性别、语速等属性进行个性化定制,获得播音级专业配音体验,MOS评分达到4.7,适用于影视、游戏等场景。

7、Windsurf Wave4版本发布,新增预览功能、支持指哪改哪

Codeium最新发布的Windsurf Wave4为程序员带来了全新的编码体验,特别是新增的预览功能使得修改代码时能够即时看到效果,极大提升了编码效率。Tab to Import功能让添加依赖变得更加轻松,Cascade小助手则为下一步操作提供智能建议。

image.png

【AiBase提要:】

🔍 预览功能让你在修改代码时即时查看效果,提升编码效率。

⌨️ Tab to Import功能简化了依赖包的添加过程,极大提高了工作流。

🛠️ Linter集成实时检查代码质量,确保生成代码的准确性。

详情链接:https://codeium.com/blog/windsurf-wave-4

8、Anthropic Console新平台上线,支持团队协作编辑管理promp功能

Anthropic最近对其开发者平台进行了重要升级,推出了全新的团队协作功能和Claude3.7Sonnet模型的扩展推理能力,旨在解决企业在人工智能实施中的痛点。新功能包括可分享的prompts、思考可视化和自动生成高质量prompts的工具,极大提升了团队协作效率和模型性能,确保开发者能够更轻松地管理和优化他们的AI模型。

【AiBase提要:】

🤝 升级后的Anthropic Console支持团队协作,提供可分享的prompts功能,提升协作效率。

🧠 Claude3.7Sonnet模型支持扩展思考过程的可视化,增强了模型的响应能力和思考预算控制。

⚙️ Console提供自动优化和模型响应评估功能,帮助用户生成高质量的prompts并进行有效测试。

详情链接:https://www.anthropic.com/news/upgraded-anthropic-console

9、Manus回应官方X账号被冻结:与加密货币诈骗无关

Manus联合创始人季逸超对公司官方X账号被冻结事件进行了回应,强调该事件与加密货币诈骗无关,并表示Manus从未参与任何加密货币项目。公司正在采取法律行动以保护品牌形象,并鼓励用户举报可疑账户。同时,Manus预计将在未来几天内恢复账号运营,并继续通过其他社交媒体与用户沟通。

image.png

【AiBase提要:】

🔒 官方X账号因可能与加密货币诈骗有关而被冻结,Manus正在与X团队合作解决问题。

🚫 Manus声明未参与任何加密货币项目,冒名顶替者均属欺诈行为,已采取法律行动。

📈 Manus是全球首款通用Agent产品,能独立执行复杂任务,应用于多种场景。

10、稳居第一!ChatGPT周活跃用户数达4亿,仅用六个月实现翻倍

根据Andreessen Horowitz发布的报告,OpenAI的ChatGPT在2024年下半年展现了惊人的用户增长,周活跃用户数在短短六个月内翻倍,达到4亿。自2022年推出以来,ChatGPT的用户增长速度令人瞩目,尤其是其不断迭代的功能和模型,如GPT-4o和高级语音模式,极大推动了用户的持续增长。

image.png

【AiBase提要:】

📈 ChatGPT周活跃用户数在2024年短短六个月内翻倍,达到4亿,展现出惊人的增长势头。

🛠️ 其不断迭代升级的功能和模型是用户增长的关键,特别是GPT-4o和高级语音模式的推出。

📱 ChatGPT在移动端表现稳健,移动用户占其周活跃用户的43.75%,显示出强大的用户粘性。

11、腾讯元宝功能上新:允许分享长图时是否展示AI思考过程

腾讯元宝推出新功能,用户在分享长图时可以选择是否展示AI的思考过程,提升了使用AI助手的灵活性和体验。此功能允许用户根据需求分享短图或长图,操作简单,用户可随时中断思考过程,增强了个性化和多样化的分享内容。

image.png

【AiBase提要:】

🖼️ 用户可以选择分享短图或长图,提升分享内容的个性化。

⏸️ 允许用户在分享时中断AI的思考过程,灵活调整分享内容。

💻 腾讯元宝支持多平台使用,包括Windows、macOS、iOS和Android。

12、佳士得首场 AI 艺术拍卖引发争议,成交额达72.8万美元

近日,佳士得拍卖行举办了首场以人工智能为主题的艺术拍卖会,吸引了全球的关注与争议。此次拍卖会的成交额高达728,784美元,显示出年轻群体对数字艺术的浓厚兴趣。然而,超过5,600名艺术家联合签署公开信,抗议此次拍卖,认为许多作品侵犯了版权。

【AiBase提要:】

🖌️ 超过5,600名艺术家签署公开信,要求佳士得取消 AI 艺术拍卖,认为 AI 作品侵犯了版权。

💰 佳士得拍卖会最终成交额达到728,784美元,最高成交作品为《机器幻觉》,价格为277,200美元。

🌍37% 的参与者为首次注册用户,48% 的竞标者为年轻的千禧一代和 Z 世代,显示出他们对数字艺术的兴趣。

ChatGPT源码推荐:小狐狸ChatGPT付费创作系统完全开源源码

推荐关键词

24小时热搜

查看更多内容

大家正在看