编辑:[db:作者] 时间:2024-08-25 00:14:38
2023 年标志着 AI 谈天机器人和各种工具的出身、测试和初期探索。
一、OpenAI/ChatGPT-4o
OpenAI 在 5 月推出了旗舰模型 ChatGPT-4o,这是一款集视觉、听觉和实时对话于一体的 AI 谈天机器人。
它的紧张特点和功能包括:
GPT-4o 比较之前的模型,在多模态支持、相应速率等方面有所提升。
例如,GPT-4 是基于文本的措辞模型,而 GPT-4o 是跨文本、视觉和音频的端到端新模型;GPT-4o 的相应速率更快,最短可在 232 毫秒内相应音频输入,而 GPT-4 的相应速率相对较慢。
GPT-4o 的运用处景广泛,例如可以作为实时视觉助手,帮助用户实时谈论所看到的内容并获取干系信息;赞助学习,如读取 iPad 中的题目并通过语音供应学习辅导;充当实时翻译,实现不同措辞间的实时翻译;用于会议助手,记录会议内容、天生纪要和总结等;进行情绪理解与表达,通过声音理解和表达感情,更自然地与用户交互;处理图像处理与创作,根据需求对图片进行处理和创作,如添加笔墨、调度颜色等。
二、Apple/AppleIntelligence
苹果在 6 月的环球开拓者大会上公布了其 AI 项目 Apple Intelligence,估量将在秋季为下一代 iPhone、iPad 和 Mac 操作系统带来多项新功能:
措辞和图像理解与天生能力:为用户解锁提高写作和沟通的新办法,内置可全部系调用的新工具 Writing tools,让用户能在险些任何场景下对文本进行改写、校正和择要,包括邮件、备忘录、Pages 文稿和各种第三方 app。不过,Apple Intelligence 的部分功能目前存在一些利用限定。
例如,只有 iPhone 15 Pro 和 iPhone 15 Pro Max 可以访问 Apple Intelligence,对付 iPad 和 Mac 用户,则需配备 M1 或更高配的芯片支持的设备。
该系统目前仅支持英语,更多功能、措辞和平台支持须要等到后续更新。
Apple Intelligence 由多个高性能天生模型组成,其模型架构紧张包括约30亿参数确当地模型以及可通过私有云打算并在 Apple 芯片做事器上运行的更大云端措辞模型。
苹果在演习根本模型时不该用用户的私人个人数据或用户交互,并利用过滤器等办法担保数据安全和隐私。
其本地模型在一些测试中的性能优于部分其他模型,而云上模型水平基本与 GPT-4-Turbo 持平。
中信证券认为,苹果端侧 AI 落地过程中主打终端跨 app 的信息整合和调用,系统级个人助理定位更为清晰,成功拉开与现有安卓端 AI 手机的差距。
如果有一家厂商能够在 AI 手机形态上做到极致,可能是具备芯片、模型、终端、操作系统一体化上风的苹果。
三、Google/ProjectAstra、Gemini、Imagen3
谷歌在 5 月的 I/O 开拓者大会上展示了其新的专家 AI 助手原型 Project Astra,该助手基于现有的谈天机器人 Gemini 构建,能够穿透用户的手机和智能眼镜等设备。
Gemini 1.5 Pro 和 1.5 Flash 是谷歌推出的新一代人工智能谈天机器人模型,而 Imagen 3 则是其更新的图像天生器,进一步提升了图像天生的质量和多样性。
1. ProjectAstra
Project Astra 是由谷歌的 DeepMind 部门发起的一个项目,旨在创建能够理解和处理日常任务的“通用 AI 代理”。
这个项目的目标是开拓出能够与用户日常互动的 AI,比如通过智好手机或智能眼镜等设备供应帮助和信息。
该操持的愿景是让每个人都能拥有一个专家助手,这个助手可以通过用户的各种设备供应个性化做事和支持。
2. Gemini
Gemini 是谷歌开拓的一款谈天机器人,它基于前辈的自然措辞处理技能,能够理解和天生人类措辞。
Gemini 1.5 Pro 是该系列的最新版本之一,它代表了在对话能力和措辞理解方面的进一步发展。
Gemini 1.5 Pro 旨在供应更加丰富和深入的对话体验,可能包括更好的高下文理解、更准确的回答以及更人性化的交互办法。
其余,还有 Gemini 1.5 Flash,这可能是一个针对速率和效率优化的版本,能够在须要快速相应的场景中供应做事。
3. Imagen3
Imagen 是谷歌开拓的一款图像天生器,它利用人工智能技能根据用户的文本描述天生高质量、逼真的图像。
Imagen 3 是该系列的最新版本,它代表了在图像天生技能方面的主要进步。
与之前的版本相比,Imagen 3 可能在图像质量、天生速率、多样性和准确性方面都有显著提升,能够更好地知足创意专业人士和普通用户的需求。
四、Microsoft/AIPC
微软在 5 月宣告推出配备 AI 硬件和支持 AI 运用程序的 Copilot Plus PC。
这款条记本电脑专为 AI 任务设计,搭载了高性能的基于 Arm 的芯片。
其紧张特点包括:
全新系统架构与性能表现:采取由 CPU、GPU 和可实现每秒超过 40万亿次运算(40+TOPS)的全新 NPU(神经处理单元)相结合的系统架构。自6月18日起,微软 Surface 以及戴尔、宏碁、华硕、惠普、遐想等 OEM 互助伙伴将陆续推出 Windows 11 AI PC。
例如,微软公布的全新 Surface Pro 起售价999美元,配备 LCD 显示屏、XPlus 处理器、16GB RAM 和 256GB 存储空间。
如果要升级为 XElite 芯片,则性能会更强劲,新版 Surface Pro 比 Surface Pro 9的速率快最多90%。
Surface Laptop 经由重新设计,有当代的线条和超薄边框,显示屏分13.8英寸和15英寸两种尺寸,有四种新颜色可供选择,新一代较前代 Surface Laptop 5的速率快最多86%,速率超过 MacBook Air,电池续航能力也超过 MacBook Air,本地视频播放韶光长达22小时,且支持 Wi-Fi 7。
需把稳的是,不同地区的功能可用性可能会有所差异。
例如在中国大陆,Windows Copilot 无法利用,Copilot 实体按键无法利用(按 Copilot 键将开启 Windows 搜索功能),但 AI Explorer 回顾功能可用,增强版的实时翻译也可以利用。
五、Meta/Llama3
Meta 于 4 月发布了 Llama 3,这是一个开源的大型措辞模型,支持在其社交平台上利用对话式 AI。
Llama 3 以其开源特性和"大众年夜众信赖度高而受到好评,可在 WhatsApp、Instagram 和 Facebook Messenger 等多个平台上供应更加自然和直不雅观的对话体验。
它具有以下紧张特点和信息:
Meta 还开拓了一套新的高质量人类评估数据集,涵盖12个关键用例,以评估模型性能。
此外,Meta 为保持开源的领先地位,放宽了容许,首次许可开拓者利用 Llama 3.1模型的高质量输出来改进和开拓第三方 AI 模型。
2024年7月24日,Meta 发布了 Llama 3.1,在多项基准测试中一举超越 GPT-4o 和 Claude 3.5 sonnet。
Llama 3.1的405B 版本性能与最好的闭源模型性能相称,支持128K 的高下文,具有多措辞能力(包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语),良好的代码天生能力、繁芜推理能力以及工具利用能力。
同时,Meta 大方放出了90多页的论文,详细先容了预演习数据、过滤、退火、合成数据、缩放定律、根本举动步伐、并行处理、演习方法、演习后适应、工具利用、基准测试、推理策略、量化、视觉、语音和视频等内容。
六、NVIDIA/Blackwell
英伟达在 3 月推出了其下一代 AI 芯片 Blackwell,以纪念数学家 David Blackwell。
这款芯片拥有 2080亿个晶体管,其特点包括:
2024 年 5 月 15 日,谷歌 CEO 桑达尔皮查伊宣告,将在 2025 年推出与英伟达互助的 Blackwell 芯片。
同年 6 月 2 日,英伟达 CEO 黄仁勋表示 Blackwell 芯片已开始投产。
Blackwell 将帮助推动人工智能事情超越诸如识别语音或创建图像等相对大略的事情。
它的涌现反响了英伟达对未来市场需求和行业趋势的前瞻性判断,例如摩尔定律带念头能提升越来越困难,芯片迭代须要多种技能创新组合;数据中央将被视为 AI 工厂,须要考虑系统级性能、能效以及多 GPU 组合的“巨型 GPU”方案;AI 模型的规模和数据量持续增长,需降落打算干系本钱和能耗;高性能推理或天生至关主要,必须找到能在许多 GPU 上并行处理模型事情的方法等。
英伟达还构建了由 72 张 GB200构成的 DGX GB200 NVL72 超级打算机,其在内部节点间利用铜缆连接,以降落功耗。
在 HGXB200演习性能提升 3 倍,推理能力提升 15 倍的根本上,GB200 NVL72 集群将多个由 GB200驱动的系统整合到一个液冷机架中,为数据中央供应了前所未有的打算能力,可将大型措辞模型的演习速率提升 4 倍,为万亿参数的大型措辞模型推理供应 30倍的实时速率提升。
此外,英伟达推出的天下首个高速 GPU 互连技能 NVLink,为处理最大视觉打算事情负载、开释百亿亿次打算能力和万亿参数人工智能模型的全部潜力供应关键根本。
NVLink Switch 协同 NVLink 可开释数据传输能力,通过连接多个 NVLink,实现机架内和机架间全速率的 GPU 通信。
NVLink 和 NVLink Switch 整合英伟达 AI Enterprise 软件套件等,为用户供应全面的 AI 打算办理方案。
英伟达的新一代产品并不逼迫哀求利用液冷,Blackwell 架构将同时推出风冷 DGX 和液冷 MGX 两种做事器方案。
但在 AI 数据中央领域,想要发挥 Blackwell 的最大潜力,液态冷却险些是必选。
风冷散热目前仍是数据中央的主流,液冷散热技能的推广运用面临着业内尚无做事器与机柜统一接口规范标准、液冷系统架构尚在演进、初期投资高和全生命周期本钱高档寻衅。
七、Mistral/Codestral-22B
Mistral 在 5 月推出了 Codestral-22B,这是其首个代码模型,支持 80多种编程措辞,并在性能上超越了以往的代码模型。
紧张特点包括:
在其他一些编程措辞测试中,和通用版 Llama3 各有胜负,但均匀成绩小幅超过了 Llama3,且相对付 Code Llama 的上风明显。
在 Python、JS 和 Java 中的 HumanEvalFIM 评分靠近或超过 90%,均匀成绩为 91.6%,超过了参数量更大的 DeepSeek Coder 33B。
不过,Codestral 利用了全新的“非生产”(Non-Production)容许协议 MNPL,按照规定仅可用于研究目的,不能进行商用,纵然仅将其用于公司内部事务也不被许可。
Mistral 表示后续会连续发布基于 Apache 2.0协议的其他模型。
八、Anthropic/Claude3.5Sonnet
Claude 3.5 Sonnet 是 Anthropic 公司于 2024 年 6 月 21 日发布的 AI 模型。
它是 Claude 3.5 系列模型中的首个版本。
以下是 Claude 3.5 Sonnet 的一些紧张特点:
性能上风:在阅读、编码、数学和视觉等紧张 AI 基准测试中,其能力不仅超过了 Claude 3,也超越了 Anthropic 此前的旗舰模型 Claude 3 Opus。此外,Anthropic 透露公司将在今年晚些时候陆续更新别的两款大模型 Claude 3.5 Haiku 和 Claude 3.5 Opus。
同时,亚马逊云科技也宣告 Claude 3.5 Sonnet 已正式接入其 Amazon Bedrock。
如需利用 Claude 3.5 Sonnet,由于海内尚未开放利用,需把稳接管验证码的手机号码不能属于中国地区。
注册条件常日包括一个邮箱(如微软或谷歌邮箱)和一个外洋手机号。
详细注册办法可以参考干系平台的指引。
同时,除了官方渠道,还有一些其他办法可以利用 Claude 3.5 Sonnet,例如通过 slack 事情区、poe 等平台,但可能须要知足相应平台的哀求和条件。
九、Adobe/GenStudio
Adobe 在 3 月公布了 GenStudio,这是一款利用天生式AI帮助用户创建内容、管理品牌资产、跟踪活动效果并简化事情流程的运用程序。
它实质上是一个关于营销活动的一体化平台,供应了多种功能和做事,包括:
Adobe GenStudio 目前还在内部测试阶段,估量将于今年晚些时候正式推出。
其定价将根据不同公司而有所差异。
该平台的推出旨在方便用户利用 Adobe 的天生式人工智能工具创建营销活动。
Adobe 声称 Firefly 模型在商业运用上是安全的,仅利用 Adobe Stock 图片、已公开授权的内容及公共领域的内容进行演习,因此不太可能产生陵犯他人知识产权的内容。
此外,微软也创建了名为 GenStudio 的在线体验工具。
它利用了 Generative Adversarial Networks(GAN,利用两种竞争 AI 网络创建逼真图像的 AI 主流形式),借助 Azure 和 Kubernettes 的强大功能,并基于大都会艺术博物馆(The Met)弘大的艺术品数据库,可以帮助任何人创建并不存在但非常逼真的艺术品。
其核心寻衅是如何将大都会艺术博物馆的图像映射到天生它的种子上,他们利用了基于梯度低落的网络反转来学习每个图像的种子,关键是指示网络不仅要匹配目标图像的像素,还要匹配其高等特色和内容。
不过,Adobe 的 GenStudio 更为人熟知,且紧张运用于营销领域。
如果你想理解的是微软的 GenStudio 艺术创尴尬刁难象,可以通过其官方网站获取更详细的信息。
十、Salesforce/Einstein
Salesforce 在 4 月宣告其企业级谈天机器人 Einstein Copilot 全面上市,该机器人在减少幻觉和天生虚假信息方面具有上风。
只管 Einstein Copilot 的推出受到了市场的期待,但 Salesforce 的股价表现并未达到预期,反响了市场对AI产品接管度和商业成功的不愿定性。
Salesforce Einstein 是 CRM(客户关系管理)的首款全面 AI 产品。
它具有以下特点:
Einstein 可以帮助企业提高智能化程度并更好地预见客户需求,详细来说:
发卖职员可以预测潜在机会并超出客户期待。Einstein 可与许多 Salesforce 产品无缝集成,其功能广泛运用于各个领域,例如:
Einstein Sales Cloud:用于提升效率和效果,功能包括预测转化可能性,给潜在客户自动打分;基于组织的最佳实践剖析预测后续跟踪趋势,并通过发卖周期剖析制订下一步的行动操持;通过 AI 自动捕获创造新老客户的商机。此外,Einstein 还包含一些特定的平台功能,如 Einstein Bots(利用自然措辞处理技能,能够为客户供应即时帮助)、Einstein Voice(包括语音助理和语音机器人两部分,可实现笔墨与语音的相互转换,以及通过智能扬声器和 Salesforce 软件进行对话等功能)、Einstein Prediction Builder(可以通过点击的办法构建自定义预测)、Einstein Next Best Action(根据预测结果或者特定条件自动触发下一步最佳行动)、Einstein Discovery(自动剖析并创造数据中的行为模式,洞察数据中的干系关系)、Einstein Vision(可对图像进行分类,对图像中的物体进行识别)、Einstein Language(能够剖析文本的感情色彩,提取文本语义并进行分类)、Einstein Recommendation(智能推举,如商品推举、社区内容推举等)。
关于 Salesforce Einstein 的详细价格,须要联系客户主管理解。
同时,Salesforce 也会供应免费的在线培训、人工智能资源及最佳实践材料,帮助用户快速理解如何利用其人工智能技能提高组织效率和客户满意度。
本文由 @阿木聊AI(智能体) 原创发布于大家都是产品经理。
未经作者容许,禁止转载
题图来自题图来自Unsplash,基于CC0协议
该文不雅观点仅代表作者本人,大家都是产品经理平台仅供应信息存储空间做事
本站所发布的文字与图片素材为非商业目的改编或整理,版权归原作者所有,如侵权或涉及违法,请联系我们删除,如需转载请保留原文地址:http://www.baanla.com/xyj/41155.html
下一篇:返回列表
Copyright 2005-20203 www.baidu.com 版权所有 | 琼ICP备2023011765号-4 | 统计代码
声明:本站所有内容均只可用于学习参考,信息与图片素材来源于互联网,如内容侵权与违规,请与本站联系,将在三个工作日内处理,联系邮箱:123456789@qq.com