当前位置：首页 > 家装 > 装修设计 > 文章正文

万字胪陈：2024上半年最值得关注的10大年夜AI新品丨海外篇

编辑：[db:作者] 时间：2024-08-25 06:37:39

2023 年标志着 AI 谈天机器人和各种工具的出身、测试和初期探索。
2024 年则迎来了 AI 工具的成熟与广泛运用。
阿木聊AI（智能体）关注到外洋 2024 上半年最为主要的 10款 AI 产品发布，包括初创公司 Anthropic、Mistral 和 OpenAI，老牌科技巨子 Google 和 Microsoft，以及 Adobe 和 Salesforce 等做事商。

一、OpenAI/ChatGPT-4o

OpenAI 在 5 月推出了旗舰模型 ChatGPT-4o，这是一款集视觉、听觉和实时对话于一体的 AI 谈天机器人。
它的紧张特点和功能包括：

多模态理解与天生：可以对音频、视觉和文本进行实时推理，接管文本、音频和图像的任何组互助为输入，并天生文本、音频和图像的任何组合进行输出。
能更好地理解和处理繁芜信息，供应更丰富全面的回答。
实时相应能力：能够在最短 232 毫秒内相应音频输入，均匀相应韶光为 320毫秒，与人类在对话中的相应韶光相似，利用户能更流畅地与之交互，提高沟通效率。
跨模式安全性：在设计中内置了跨模式的安全性，并创建了新的安全系统，为语音输出供应护栏。
通过过滤演习数据和演习后改进模型行为等技能，保障用户信息安全，提高互动安全性。
性能提升：在传统基准测试中，其在文本、推理和代码智能方面达到了 GPT-4 turbo 级的性能，同时在多措辞、音频和视觉能力方面达到新高度。
在英文文本和代码上的性能与 GPT-4 turbo 相称，在非英文文本上有显著改进。
它在多措辞处理方面表现出色，支持多种措辞。

GPT-4o 比较之前的模型，在多模态支持、相应速率等方面有所提升。
例如，GPT-4 是基于文本的措辞模型，而 GPT-4o 是跨文本、视觉和音频的端到端新模型；GPT-4o 的相应速率更快，最短可在 232 毫秒内相应音频输入，而 GPT-4 的相应速率相对较慢。

GPT-4o 的运用处景广泛，例如可以作为实时视觉助手，帮助用户实时谈论所看到的内容并获取干系信息；赞助学习，如读取 iPad 中的题目并通过语音供应学习辅导；充当实时翻译，实现不同措辞间的实时翻译；用于会议助手，记录会议内容、天生纪要和总结等；进行情绪理解与表达，通过声音理解和表达感情，更自然地与用户交互；处理图像处理与创作，根据需求对图片进行处理和创作，如添加笔墨、调度颜色等。

二、Apple/AppleIntelligence

苹果在 6 月的环球开拓者大会上公布了其 AI 项目 Apple Intelligence，估量将在秋季为下一代 iPhone、iPad 和 Mac 操作系统带来多项新功能：

措辞和图像理解与天生能力：为用户解锁提高写作和沟通的新办法，内置可全部系调用的新工具 Writing tools，让用户能在险些任何场景下对文本进行改写、校正和择要，包括邮件、备忘录、Pages 文稿和各种第三方 app。
例如可帮助用户整理教室条记，检讨文章是否畅通等；改写工具可根据受众和文稿诉求调度文风；proofread 工具能检讨语法、说话和语句构造，并给出修正建议及解释；summarize 工具可对用户选中文本进行归纳总结。
备忘录 app 和电话 app 可让用户录制音频，并将音频转写成文本以及天生内容择要。
供应有趣的图像创作功能：借助于 image playground，用户可在数秒间创作出有趣的图像，且有动画、插画、手绘三种样式选择，还可根据不同分类或自定义描述进行创作，也能从照片图库中选取人物添加在图像内。
该功能直接内置在信息等多款 app 中，也可作为单独的 app 安装利用。
在信息 app 中利用时，用户可快速创作出意见意义图像发送给朋友，并会看到基于当前对话天生的个性化创意推举；在备忘录 app 中，用户可通过 Apple Pencil 工具盘中新增的 image wand 工具调用 image playground，为条记添加更多视觉意见意义性。
情景驱动的关照：可以识别对用户个人情境主要的关照。
Priority notifications 会涌如今分组关照的最上方，提示最为主要的事变，还有内容择要帮助用户快速浏览大量或已分组的关照，直接在锁定屏幕上显示详细信息。
全新专注模式“reduce interruptions”仅会显示可能须要即刻被看到的关照。
跨运用程序任务处理：能够深入研究用户的运用程序并代表用户实行任务。
例如让 siri 播放女友发来的播客，或在收到邮件关照会议延期时，讯问 siri 是否还能遇上和朋友之前约的电影，siri 可以综合调用短信、邮件、舆图等工具来进行判断。
关注个人背景：利用用户的全部活动和屏幕上的内容，例如用户可以讯问会议转移是否会导致迟到。
更智能的 siri：在其加持下 siri 将更加深入地融入到系统体验中。
siri 涌现时屏幕周围会闪烁发光，用户可以通过文本利用 siri，它能实时纠正用户的陈述，并供应与操作系统更紧密集成的新外不雅观。
它支持连续对话和高下文理解，能联系高下文，剖析不连贯或改动过的措辞。
还具备屏幕内容理解能力，例如可把朋友发来的地址信息添加到朋友的地址中，用户也能设置与 siri 进行对话的办法（语音或笔墨），并自由在笔墨和语音之间切换。

不过，Apple Intelligence 的部分功能目前存在一些利用限定。
例如，只有 iPhone 15 Pro 和 iPhone 15 Pro Max 可以访问 Apple Intelligence，对付 iPad 和 Mac 用户，则需配备 M1 或更高配的芯片支持的设备。
该系统目前仅支持英语，更多功能、措辞和平台支持须要等到后续更新。

Apple Intelligence 由多个高性能天生模型组成，其模型架构紧张包括约30亿参数确当地模型以及可通过私有云打算并在 Apple 芯片做事器上运行的更大云端措辞模型。
苹果在演习根本模型时不该用用户的私人个人数据或用户交互，并利用过滤器等办法担保数据安全和隐私。
其本地模型在一些测试中的性能优于部分其他模型，而云上模型水平基本与 GPT-4-Turbo 持平。

中信证券认为，苹果端侧 AI 落地过程中主打终端跨 app 的信息整合和调用，系统级个人助理定位更为清晰，成功拉开与现有安卓端 AI 手机的差距。
如果有一家厂商能够在 AI 手机形态上做到极致，可能是具备芯片、模型、终端、操作系统一体化上风的苹果。

三、Google/ProjectAstra、Gemini、Imagen3

谷歌在 5 月的 I/O 开拓者大会上展示了其新的专家 AI 助手原型 Project Astra，该助手基于现有的谈天机器人 Gemini 构建，能够穿透用户的手机和智能眼镜等设备。
Gemini 1.5 Pro 和 1.5 Flash 是谷歌推出的新一代人工智能谈天机器人模型，而 Imagen 3 则是其更新的图像天生器，进一步提升了图像天生的质量和多样性。

1. ProjectAstra

Project Astra 是由谷歌的 DeepMind 部门发起的一个项目，旨在创建能够理解和处理日常任务的“通用 AI 代理”。
这个项目的目标是开拓出能够与用户日常互动的 AI，比如通过智好手机或智能眼镜等设备供应帮助和信息。

该操持的愿景是让每个人都能拥有一个专家助手，这个助手可以通过用户的各种设备供应个性化做事和支持。

2. Gemini

Gemini 是谷歌开拓的一款谈天机器人，它基于前辈的自然措辞处理技能，能够理解和天生人类措辞。
Gemini 1.5 Pro 是该系列的最新版本之一，它代表了在对话能力和措辞理解方面的进一步发展。

Gemini 1.5 Pro 旨在供应更加丰富和深入的对话体验，可能包括更好的高下文理解、更准确的回答以及更人性化的交互办法。

其余，还有 Gemini 1.5 Flash，这可能是一个针对速率和效率优化的版本，能够在须要快速相应的场景中供应做事。

3. Imagen3

Imagen 是谷歌开拓的一款图像天生器，它利用人工智能技能根据用户的文本描述天生高质量、逼真的图像。
Imagen 3 是该系列的最新版本，它代表了在图像天生技能方面的主要进步。

与之前的版本相比，Imagen 3 可能在图像质量、天生速率、多样性和准确性方面都有显著提升，能够更好地知足创意专业人士和普通用户的需求。

四、Microsoft/AIPC

微软在 5 月宣告推出配备 AI 硬件和支持 AI 运用程序的 Copilot Plus PC。
这款条记本电脑专为 AI 任务设计，搭载了高性能的基于 Arm 的芯片。

其紧张特点包括：

全新系统架构与性能表现：采取由 CPU、GPU 和可实现每秒超过 40万亿次运算（40+TOPS）的全新 NPU（神经处理单元）相结合的系统架构。
它是有史以光降盆的更快、更智能的 Windows PC，在设备本地解锁了一系列全新 AI 体验。
例如，通过新功能“回顾”（Recall）可以轻松回顾和找寻此前在 PC 上看过的内容，能帮助用户根据影象中的线索碎片快速、直不雅观地检索出想要探求的内容。
该功能仅限于个人确当地设备，不会利用任何信息演习 AI 模型。
其余，它还支持增强的 Windows 事情室效果、实时字幕等功能，实时字幕可以将自动将任意 app 或视频平台上的直播或录播音频即时翻译成英笔墨幕，支持包含中文在内的40多种措辞翻译，即便用户处于离线状态，也能实现该功能。
高效的芯片：首批 Windows 11 AI PC 搭载高通的桌面处理器骁龙（Snapdragon）XElite 芯片，这款首创性平台将重塑性能，凭借一流的 CPU 性能、领先的终端侧 AI 推理和支持多天续航的高能效 PC 处理器，显著提升 PC 体验。
它采取定制的集成高通 Oryon CPU，4 纳米制程工艺，拥有 12 个高性能内核，在每瓦特性能方面保持领先。
当用户须要最高性能时，Oryon CPU 还可以通过双核增强加速个中 2 个高性能 CPU 内核，从而为用户供应超快相应。
集成的 Adreno GPU 能够实现出色图形性能，带来沉浸式娱乐体验。
骁龙 XElite 采取的高通 AI 引擎具有领先的异构打算架构，Hexagon NPU、Adreno GPU 和 Oryon CPU 等可共同实现超过 70TOPS 的算力。
个中，高通 Hexagon NPU 是高通 AI 引擎的核心，算力高达 45TOPS，是目前市场中面向条记本电脑的环球最快 NPU，并具备领先的每瓦特性能。
骁龙 XElite 不仅支持在终端侧运行超过 130亿参数的天生式 AI 模型，并且目前独家支持 Windows 11 AI PC。
此外，该芯片充分发挥骁龙在移动打算领域的专长，支持超快 5G 和 Wi-Fi 7 连接，能够带来无缝、无卡顿的极速连接体验，还支持 Snapdragon Seamless 体验、微软安全核心电脑（Microsoft Secured-Core PC）等安全特性，打造从芯片到云的安全体验。
丰富的运用体验：Windows 率先与高通互助，供应了大量 arm64 原生运用程序体验，既有 PowerPoint、Word 等 Microsoft 365 的 app，又有爱奇艺、B 站、Foxit PDF Editor 专业版、酷狗音乐、QQ、QQ 音乐和网易有道翻译等。
Adobe 系列旗舰级 app 也即将上岸 Windows 11 AI PC，个中包括 Photoshop、Lightroom 和 Express 已于本周一上线，今年夏季还将推出 Illustrator、Premiere Pro 及更多 app。
在 LiquidText 中，利用完备由 NPU 驱动确当地 AI 功能，可更快、更智能地对文档进行注释，从而担保数据隐私。
全新的 Windows Copilot Runtime 中有超过 40个 AI 模型，为“回顾”等功能供应支持。
能效表现与续航能力：具有惊人的能效表现，单次充电即可支持长达 22 小时确当地视频播放或 15 小时的网页浏览，知足用户一整天的利用。
安全特性：所有 Windows 11 AI PC 都是安全核心 PC（Secured-Core PC），默认启用了 Microsoft Pluton Security 处理器，并引入了许多新的功能、更新和默认设置，确保用户隐私数据安全。

自6月18日起，微软 Surface 以及戴尔、宏碁、华硕、惠普、遐想等 OEM 互助伙伴将陆续推出 Windows 11 AI PC。
例如，微软公布的全新 Surface Pro 起售价999美元，配备 LCD 显示屏、XPlus 处理器、16GB RAM 和 256GB 存储空间。
如果要升级为 XElite 芯片，则性能会更强劲，新版 Surface Pro 比 Surface Pro 9的速率快最多90%。
Surface Laptop 经由重新设计，有当代的线条和超薄边框，显示屏分13.8英寸和15英寸两种尺寸，有四种新颜色可供选择，新一代较前代 Surface Laptop 5的速率快最多86%，速率超过 MacBook Air，电池续航能力也超过 MacBook Air，本地视频播放韶光长达22小时，且支持 Wi-Fi 7。

需把稳的是，不同地区的功能可用性可能会有所差异。
例如在中国大陆，Windows Copilot 无法利用，Copilot 实体按键无法利用（按 Copilot 键将开启 Windows 搜索功能），但 AI Explorer 回顾功能可用，增强版的实时翻译也可以利用。

五、Meta/Llama3

Meta 于 4 月发布了 Llama 3，这是一个开源的大型措辞模型，支持在其社交平台上利用对话式 AI。
Llama 3 以其开源特性和公众信赖度高而受到好评，可在 WhatsApp、Instagram 和 Facebook Messenger 等多个平台上供应更加自然和直不雅观的对话体验。
它具有以下紧张特点和信息：

性能提升：在多种行业基准测试上展现了前辈的性能，供应了包括改进的推理能力等新功能。
演习数据：在两个定制的24K GPU 集群上，利用超过15T的公开数据进行演习，这些数据量是 Llama 2 数据集的7倍多，个中包含的代码数据是 Llama 2 的4倍，并且有超过5%的预演习数据集由涵盖30多种措辞的高质量非英语数据组成。
模型架构：选择了相对标准的纯解码器 Transformer 架构，并做了关键改进，如利用具有128K token词汇表的分词器，能更有效地对措辞进行编码，从而显著提高模型性能；在8B 和70B 大小的模型上采取了分组查询把稳力（GQA）以提高推理效率；在8192个 token 的序列上演习模型，利用掩码确保自把稳力不会超过文档边界。
支持长文本：支持8K 长文本，高下文长度是 Llama 2 的两倍。
指令微调：后演习过程的改进大大降落了模型出错率，进一步改进了同等性，并增加了模型相应的多样性。
演习效率：演习效率比 Llama 2 高3倍。
新的能力：具备增强的推理和代码能力，能够进行繁芜的推理，可以更遵照指令，能够可视化想法并办理很多奇妙的问题，还支持零样本工具利用，包括网络搜索、数学运算和代码实行等。
通过微调，它在调用自定义工具方面供应了强大的灵巧性。
版本开源：已开放80亿（8B）和700亿（70B）两个小参数版本用于预演习和微调，并面向开拓者开源，包括预演习和微调版本。
Meta 称正在开拓的最大模型是400B+参数，未来几个月内将推出多模态版本。
运用广泛：可用于升级 Meta AI 工具，同时会整合到 Meta 旗下的 Facebook、Instagram、WhatsApp 和 Messenger 等紧张平台的搜索功能中。
Llama 3 模型也将在亚马逊 AWS、Databricks、谷歌云、Hugging Face、Kaggle、IBM WatsonX、微软云 Azure、英伟达 NIM 和 Snowflake 上被供应给开拓者，并得到 AMD、AWS、戴尔、英特尔、英伟达和高通供应的硬件平台支持。

Meta 还开拓了一套新的高质量人类评估数据集，涵盖12个关键用例，以评估模型性能。
此外，Meta 为保持开源的领先地位，放宽了容许，首次许可开拓者利用 Llama 3.1模型的高质量输出来改进和开拓第三方 AI 模型。

2024年7月24日，Meta 发布了 Llama 3.1，在多项基准测试中一举超越 GPT-4o 和 Claude 3.5 sonnet。
Llama 3.1的405B 版本性能与最好的闭源模型性能相称，支持128K 的高下文，具有多措辞能力（包括英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语），良好的代码天生能力、繁芜推理能力以及工具利用能力。
同时，Meta 大方放出了90多页的论文，详细先容了预演习数据、过滤、退火、合成数据、缩放定律、根本举动步伐、并行处理、演习方法、演习后适应、工具利用、基准测试、推理策略、量化、视觉、语音和视频等内容。

六、NVIDIA/Blackwell

英伟达在 3 月推出了其下一代 AI 芯片 Blackwell，以纪念数学家 David Blackwell。
这款芯片拥有 2080亿个晶体管，其特点包括：

采取了台积电 4np 工艺生产。
实际上是两个芯片通过连接结合在一起，以确保可以作为一个整体无缝运行，通过英伟达的高带宽接口（nv-hbi），能以 10tb/s 双向带宽互联，可支持更高的 l2 缓存带宽，没有内存局部性问题和缓请安题。
在处理支持人工智能的模型方面可将速率提高数倍，包括演习阶段和推理阶段。
英伟达在发布会上表示，相较于之前的 H100芯片，Blackwell GB200超级芯片可以为大措辞模型（LLM）推理负载供应 30倍的性能提升，并将本钱和能耗降落 25 倍。

2024 年 5 月 15 日，谷歌 CEO 桑达尔皮查伊宣告，将在 2025 年推出与英伟达互助的 Blackwell 芯片。
同年 6 月 2 日，英伟达 CEO 黄仁勋表示 Blackwell 芯片已开始投产。

Blackwell 将帮助推动人工智能事情超越诸如识别语音或创建图像等相对大略的事情。
它的涌现反响了英伟达对未来市场需求和行业趋势的前瞻性判断，例如摩尔定律带念头能提升越来越困难，芯片迭代须要多种技能创新组合；数据中央将被视为 AI 工厂，须要考虑系统级性能、能效以及多 GPU 组合的“巨型 GPU”方案；AI 模型的规模和数据量持续增长，需降落打算干系本钱和能耗；高性能推理或天生至关主要，必须找到能在许多 GPU 上并行处理模型事情的方法等。

英伟达还构建了由 72 张 GB200构成的 DGX GB200 NVL72 超级打算机，其在内部节点间利用铜缆连接，以降落功耗。
在 HGXB200演习性能提升 3 倍，推理能力提升 15 倍的根本上，GB200 NVL72 集群将多个由 GB200驱动的系统整合到一个液冷机架中，为数据中央供应了前所未有的打算能力，可将大型措辞模型的演习速率提升 4 倍，为万亿参数的大型措辞模型推理供应 30倍的实时速率提升。

此外，英伟达推出的天下首个高速 GPU 互连技能 NVLink，为处理最大视觉打算事情负载、开释百亿亿次打算能力和万亿参数人工智能模型的全部潜力供应关键根本。
NVLink Switch 协同 NVLink 可开释数据传输能力，通过连接多个 NVLink，实现机架内和机架间全速率的 GPU 通信。
NVLink 和 NVLink Switch 整合英伟达 AI Enterprise 软件套件等，为用户供应全面的 AI 打算办理方案。

英伟达的新一代产品并不逼迫哀求利用液冷，Blackwell 架构将同时推出风冷 DGX 和液冷 MGX 两种做事器方案。
但在 AI 数据中央领域，想要发挥 Blackwell 的最大潜力，液态冷却险些是必选。
风冷散热目前仍是数据中央的主流，液冷散热技能的推广运用面临着业内尚无做事器与机柜统一接口规范标准、液冷系统架构尚在演进、初期投资高和全生命周期本钱高档寻衅。

七、Mistral/Codestral-22B

Mistral 在 5 月推出了 Codestral-22B，这是其首个代码模型，支持 80多种编程措辞，并在性能上超越了以往的代码模型。
紧张特点包括：

参数量：具有 220亿（22B）参数。
多措辞支持：在 80多种编程措辞的数据集上进行过演习，既包括 Python、Java、C++、Bash 等盛行措辞，也有像 Fortran、COBOL 这样的古早措辞，个中 COBOL 出身于 1959 年，但至今仍有 43%的银行系统依赖它。
性能表现：虽然参数量少于 70B 的 Code Llama，但在多种测评中取得了更优成绩。
例如在针对 Python 措辞的 HumanEval（pass@1）、MBPP 以及 CruxEval 等测试中表现出色，在 RepoBench 评估的远程存储库中的代码补全能力方面达到了最佳成绩，并对 Llama 3 和 Code Llama 形成了全面超越。
在数据库的 SQL Spider 测试中，其表现也与通用模型 Llama3 十分靠近。

在其他一些编程措辞测试中，和通用版 Llama3 各有胜负，但均匀成绩小幅超过了 Llama3，且相对付 Code Llama 的上风明显。
在 Python、JS 和 Java 中的 HumanEvalFIM 评分靠近或超过 90%，均匀成绩为 91.6%，超过了参数量更大的 DeepSeek Coder 33B。

长高下文窗口：支持 32k 的高下文窗口，比较其他模型（常日为 4k、8k 或 16k）大幅增加。
代码编辑能力：支持 FIM（fill-in-the-middle），可以对现有代码进行添补补全。
利用办法多样：Mistral 已将模型权重上传到了 HuggingFace，可供有条件的用户自行下载支配。
此外，LangChain、LlamaIndex、Ollama 等大模型框架以及 Mistral 自家的开拓者平台 La Plateforme 已支持利用 Codestral。
它还供应了专属 API，个中 codestral.mistral.ai 正在进行免费测试，api.mistral.ai 则按 token 收费。
用户也可通过 Mistral 的在线对话平台 Le Chat 直策应用网页进行对话。
同时，第三方插件 continue.dev、Tabnine 支持通过在 VSCode 和 JetBrains 系列 IDE 中利用 Codestral。

不过，Codestral 利用了全新的“非生产”（Non-Production）容许协议 MNPL，按照规定仅可用于研究目的，不能进行商用，纵然仅将其用于公司内部事务也不被许可。
Mistral 表示后续会连续发布基于 Apache 2.0协议的其他模型。

八、Anthropic/Claude3.5Sonnet

Claude 3.5 Sonnet 是 Anthropic 公司于 2024 年 6 月 21 日发布的 AI 模型。
它是 Claude 3.5 系列模型中的首个版本。

以下是 Claude 3.5 Sonnet 的一些紧张特点：

性能上风：在阅读、编码、数学和视觉等紧张 AI 基准测试中，其能力不仅超过了 Claude 3，也超越了 Anthropic 此前的旗舰模型 Claude 3 Opus。
在研究生水平推理（GPQA）、编码能力（HumanEval）、文本推理（DROP）等方面表现出色，成绩优于 GPT-4o，但在数学问题办理能力上稍逊于后者。
它能够更好地理解指令之间的细微差别，有更强的诙谐能力，还为包括 GPQA（研究生水平推理）、MMLU（本科生水平知识）与 HumanEval 等基准测试设立了全新的行业标准。
根据内部代理编码评估，其办理了64%的问题，远超 Claude 3 Opus 的38%。
视觉能力：作为一款多模态大模型，其视觉能力有较大提升。
它可以更准确地阐明图表和图形，能在带有扭曲和视觉伪像等“不完美”图像中顺利完成文本转录任务，在所有标准视觉基准测试中的均匀表现比 Claude 3 Opus 赶过 10%。
它善于阐明和剖析视觉数据，例如理解繁芜的图表、图形和图解，剖析信息图表和科学可视化，阐明场景中的空间关系等；可以无缝领悟图像和文本的信息；能够准确识别和描述图像中的物体；支持视觉问答，可根据视觉剖析供应答案；能利用视觉信息来帮忙办理问题；可以供应有关艺术风格、设计元素和视觉美学的见地；展示了识别和转录手写文本的改进能力；可以从视觉呈现的数据中提取干系信息，还能处理多种文本样式以及转录多种措辞的文本，并理解图像中文本的高下文，在转录构造化文本时常日可以保留或描述原始格式。
运行速率与本钱：运行速率是 Claude 3 Opus 的两倍，而价格仅为后者的五分之一。
其输入价格为 3 美元/百万 tokens，输出价格为 15 美元/百万 tokens，高下文窗口长度达 200k tokens。
新功能：Anthropic 推出了 Artifacts 预览版，这是一个可供用户添加和编辑其模型天生内容的事情空间，例如用其天生的代码、文档、图像、网站设计等内容创建作品。
该产品会在 Claude 的 web 客户端设置一个专用窗口，类似于将大模型接入事情流。

此外，Anthropic 透露公司将在今年晚些时候陆续更新别的两款大模型 Claude 3.5 Haiku 和 Claude 3.5 Opus。
同时，亚马逊云科技也宣告 Claude 3.5 Sonnet 已正式接入其 Amazon Bedrock。

如需利用 Claude 3.5 Sonnet，由于海内尚未开放利用，需把稳接管验证码的手机号码不能属于中国地区。
注册条件常日包括一个邮箱（如微软或谷歌邮箱）和一个外洋手机号。
详细注册办法可以参考干系平台的指引。
同时，除了官方渠道，还有一些其他办法可以利用 Claude 3.5 Sonnet，例如通过 slack 事情区、poe 等平台，但可能须要知足相应平台的哀求和条件。

九、Adobe/GenStudio

Adobe 在 3 月公布了 GenStudio，这是一款利用天生式AI帮助用户创建内容、管理品牌资产、跟踪活动效果并简化事情流程的运用程序。
它实质上是一个关于营销活动的一体化平台，供应了多种功能和做事，包括：

品牌工具包、文案建议、预审合格的资源：可用于天生符合品牌风格的活动背景和整体基调。
多种天生式人工智能工具：能帮助用户迅速为电子邮件及 Facebook、Instagram 和 LinkedIn 等社交媒体平台制作广告。
内容中央：供应直不雅观界面，方便搜索、编辑、重复利用和分享营销活动的素材。
活动管理：供应集中的活动概览，包括活动简介和活动韶光表，使活动策划过程更高效。
发布功能：与 Adobe Experience Cloud 的多个产品（如 Journey Optimizer、Experience Manager、Marketo 和 Target）无缝集成，也可轻松导出到其他第三方运用。
数据洞察：让营销职员可以实时理解内容在不同渠道的利用情形和效果，通过 AI 技能天生不同的内容版本，进而提升活动效果。

Adobe GenStudio 目前还在内部测试阶段，估量将于今年晚些时候正式推出。
其定价将根据不同公司而有所差异。

该平台的推出旨在方便用户利用 Adobe 的天生式人工智能工具创建营销活动。
Adobe 声称 Firefly 模型在商业运用上是安全的，仅利用 Adobe Stock 图片、已公开授权的内容及公共领域的内容进行演习，因此不太可能产生陵犯他人知识产权的内容。

此外，微软也创建了名为 GenStudio 的在线体验工具。
它利用了 Generative Adversarial Networks（GAN，利用两种竞争 AI 网络创建逼真图像的 AI 主流形式），借助 Azure 和 Kubernettes 的强大功能，并基于大都会艺术博物馆（The Met）弘大的艺术品数据库，可以帮助任何人创建并不存在但非常逼真的艺术品。
其核心寻衅是如何将大都会艺术博物馆的图像映射到天生它的种子上，他们利用了基于梯度低落的网络反转来学习每个图像的种子，关键是指示网络不仅要匹配目标图像的像素，还要匹配其高等特色和内容。

不过，Adobe 的 GenStudio 更为人熟知，且紧张运用于营销领域。
如果你想理解的是微软的 GenStudio 艺术创尴尬刁难象，可以通过其官方网站获取更详细的信息。

十、Salesforce/Einstein

Salesforce 在 4 月宣告其企业级谈天机器人 Einstein Copilot 全面上市，该机器人在减少幻觉和天生虚假信息方面具有上风。
只管 Einstein Copilot 的推出受到了市场的期待，但 Salesforce 的股价表现并未达到预期，反响了市场对AI产品接管度和商业成功的不愿定性。

Salesforce Einstein 是 CRM（客户关系管理）的首款全面 AI 产品。
它具有以下特点：

数据就绪：无需准备数据或管理模型，只需将数据放入 Salesforce 即可利用。
建模就绪：多租户自动机器学习意味着会为组织自动匹配恰当的模型。
生产就绪：依托同样可信赖的 Salesforce 平台，具有模型管理和监控工具。

Einstein 可以帮助企业提高智能化程度并更好地预见客户需求，详细来说：

发卖职员可以预测潜在机会并超出客户期待。
做事职员可以避免潜在问题发生，变被动为主动。
营销职员可以开展预见性的活动，营造前所未有的个性化体验。
IT 职员可以将智能融入每个角落并为员工和客户创建更加智能的运用程序。

Einstein 可与许多 Salesforce 产品无缝集成，其功能广泛运用于各个领域，例如：

Einstein Sales Cloud：用于提升效率和效果，功能包括预测转化可能性，给潜在客户自动打分；基于组织的最佳实践剖析预测后续跟踪趋势，并通过发卖周期剖析制订下一步的行动操持；通过 AI 自动捕获创造新老客户的商机。
Einstein Service Cloud：用于提升效率和做事体验，功能包括自动预测和添补案例的干系字段；自动根据客户要求路由做事和处理职员，减少客户等待和切换韶光；智能客服功能，根据客户的对话信息和高下文信息，供应知识建媾和对话建议，帮忙客服职员更快办理问题。
2022 年起重磅推出 ChatGPT AI。
Einstein Marketing Cloud：供应客户洞察和预测，深入理解客户；打仗客户的渠道和韶光点的智能建议；为客户供应一对一的个性化和内容，实现千人千面。
Einstein Commerce Cloud：个性化商品推举，提升客单价和复购率；客户行为模式仪表板，为商品推销和营销供应数据支撑；个性化显式搜索排序（搜索框）、个性化隐式搜索排序（首页浏览、品类页浏览）。
Einstein Community：推举干系的专业人士、小组和内容，降落社区成员探求所需资源的难度；借助智能的活动源，确保社区成员可以看到主要帖子和热门话题等高人气内容，从而担保成员持续参与；帮助社区成员探求经由认证的干系专业人士，以便于他们尽快办理最要紧的问题。

此外，Einstein 还包含一些特定的平台功能，如 Einstein Bots（利用自然措辞处理技能，能够为客户供应即时帮助）、Einstein Voice（包括语音助理和语音机器人两部分，可实现笔墨与语音的相互转换，以及通过智能扬声器和 Salesforce 软件进行对话等功能）、Einstein Prediction Builder（可以通过点击的办法构建自定义预测）、Einstein Next Best Action（根据预测结果或者特定条件自动触发下一步最佳行动）、Einstein Discovery（自动剖析并创造数据中的行为模式，洞察数据中的干系关系）、Einstein Vision（可对图像进行分类，对图像中的物体进行识别）、Einstein Language（能够剖析文本的感情色彩，提取文本语义并进行分类）、Einstein Recommendation（智能推举，如商品推举、社区内容推举等）。

关于 Salesforce Einstein 的详细价格，须要联系客户主管理解。
同时，Salesforce 也会供应免费的在线培训、人工智能资源及最佳实践材料，帮助用户快速理解如何利用其人工智能技能提高组织效率和客户满意度。

本文由 @阿木聊AI（智能体）原创发布于大家都是产品经理。
未经作者容许，禁止转载

题图来自题图来自Unsplash，基于CC0协议

该文不雅观点仅代表作者本人，大家都是产品经理平台仅供应信息存储空间做事

本站所发布的文字与图片素材为非商业目的改编或整理，版权归原作者所有，如侵权或涉及违法，请联系我们删除，如需转载请保留原文地址：http://www.baanla.com/lz/zxsj/159805.html

上一篇：实探深圳消费电子市场：家当链景气度明显回升有国产新款手机“一机难求”

下一篇：返回列表

万字胪陈：2024上半年最值得关注的10大年夜AI新品丨海外篇

相关文章

推荐标签

装修设计推荐

装修设计热门