大模型挑选指南来了！涵盖六种情况下的选择方案，为你匹配最佳模型｜来自沃顿商学院教授

发表于 2023/7/19 13:48:36 阅读（738）

　　西风发自凹非寺

　　量子位 | 公众号 QbitAI

　　最近Claude 2亮相、谷歌Bard支持中文、Open AI推出Code Interpreter（代码解释器）……

　　大模型发布一波接着一波，但五花八门，没有一个可解决所有问题。

　　所以不同任务到底该用哪一个？

　　别着急，这不来自宾夕法尼亚大学沃顿商学院的Ethan Mollick教授整理了一份挑选指南。

　　选择困难症“患者”这下有救了！

　　这份指南不仅涵盖了截至今年夏季的最新情况，而且在不同的任务中，还附上了不同大模型的表现对比。

　　手把手教你在六个使用场景下挑选大模型，还有最佳免费选项、付费选项。

　　网友看到后表示：

　　先替我同事收藏了。

　　一起来康康这份挑选指南里都有啥。

　　用不同大模型来做这六件事

　　一、撰写文字

　　最佳免费选项：Bing 、Claude 2

　　付费选项：ChatGPT 4.0、ChatGPT+插件

　　AI写作这一块，Ethan Mollick教授认为，GPT-4目前仍是最靠谱的工具。

　　家人们还可以选择用免费的Bing（创意模式creative mode），Claude也是一个不错的选择。

　　具体来说，用大模型可以帮你做这些事：打草稿、优化写作内容、协助完成任务、解锁自己（AI可以给你提供一种克服困难的方式）。

　　此外，这些工具还被整合到了一些办公应用程序中，比如Microsoft Office+GPT、Google Docs+Bard。

　　上面这些大模型在文字写作方面的表现都不错，但也都有可能产生“幻觉”，胡言乱语。特别是要求未联网的大模型提供互联网的参考、引用信息。

　　Bing相较而言产生的“幻觉”更少，因为GPT-4表现效果通常更好，而且Bing连接网络可以真正获取相关事实信息。

　　Ethan Mollick教授在此前的使用中还发现一个问题：

　　AI并不能解释自己，它只是让你以为它在解释。

　　如果你要求它解释为什么写了某个东西，它会给你一个看似合理但完全是捏造的答案。当你询问它的思考过程时，它并不是在真正审问自己的行为，只是生成一些听起来像是在这样做的文本。

　　二、制作图像

　　最透明的选项：Adobe Firefly

　　开源选项：Stable Diffusion

　　最佳免费选项：Bing、Bing Image Creator（使用DALL-E），Playground（可以使用多个模型）

　　最高质量的图像：Midjourney

　　目前主要的图像生成工具包括：

Stable Diffusion：已开源，特别适合与其它来源的图像结合使用（使用指南见文末）。
DALL-E：来自OpenAI，已整合到Bing（需用创意模式）和Bing Image Creator（Bing图像生成器）中。DALL-E很可靠，但比Midjourney差一些。
Midjourney：今年年中最好的系统，学习曲线（learning-curve）是所有系统中最低的。只需输入”thing-you-want-to-see —v 5.2”（末尾的—v 5.2很重要，使用最新的模型），就能得到非常不错的结果。Midjourney需要使用Discord（使用指南见文末）。
Adobe Firefly：集成在Adobe产品中的，但在生成图片质量方面不如DALL-E和Midjourney。Adobe称他们在训大模型时，只使用有使用权的图像。

　　大模型各自的表现是这样婶儿的（每张图都是同样提示下不同模型生成的第一张图）：

　　需要注意的是，受训练数据影响，这些模型难免存在一些偏见。

　　其次，训练数据大多来自互联网，缺乏透明度，图像的版权问题不够明确。

　　此外，目前图片生成中不能真正创作文本，只能生成一堆看起来像文本的东西。但Midjourney对手部的描绘很好。

　　三、构思创意

　　最佳免费选项：Bing

　　付费选项：ChatGPT 4.0（但由于Bing联网，表现可能更好）

　　要有好的创意，通常需要有大量的想法，而AI正是擅长产生大量的想法。

　　在创意模式下，可以用Bing查找你喜欢的非常规创意生成技巧，例如布莱恩·伊诺的倾斜策略（oblique strategies）或马歇尔·麦克卢汉的四元结构（tetrads），然后进行应用，或者要求模型提供一些奇怪的想法。

　　四、制作视频

　　最佳动画工具：D-iD（用于在视频中为面部添加动画效果）、Runway v2（用于通过文本创建视频）

　　最佳声音克隆：ElevenLabs

　　现在，AI生成视频方面可以来个一条龙服务：

　　从生成的角色，到剧本创建，再到配音，都可以交给AI来完成。

　　用AI工具生成的视频有时看起来还蛮逼真。Ethan Mollick教授就拿自己的照片做过一段“假视频”：

　　但需要特别注意的是，这些工具都需要合乎道德地使用。

　　五、处理文件和数据

　　数据（以及使用代码的任何奇怪想法）：Code Interpreter

　　文档：Claude 2（大型文档或同时处理多个文档），Bing（侧边栏适用于较小的文档和网页）

　　Code Interpreter可实现对上传的文件进行编写并运行代码，生成结果也可供下载。你可以用它来执行程序，进行数据分析，或者创建各种文件、网页，甚至游戏。

　　Ethan Mollick教授还设置了一个用Code Interpreter来处理数据可视化的方法（链接见文末）：

　　处理PDF文档这方面，还是要Claude 2出马。

　　Ethan Mollick教授表示曾将整本书粘贴到Claude中，还给过它许多复杂的学术文章，并要求它总结结果，Claude的表现都不错。

　　不仅如此，还可以通过继续提问进一步探讨资料，比如说这种方法的证据是什么？作者的结论是什么……

　　但有时候模型还是会产生“幻觉”，这一点还是要注意。

　　六、获取信息并学习知识

　　最佳免费选择：Bing

　　付费选项：对于儿童来说，可用Khanmigo（AI辅导）

　　Ethan Mollick教授认为最好不要把这些大模型当作搜索引擎来用，出现“幻觉”的风险很高。

　　而他建议使用Bing，也是因为Bing联网，“幻觉”会相对来说少一点。但如果谨慎使用，AI通常可以提供比搜索更有用的答案，特别是在搜索引擎给的结果不是很好的情况下。

　　此外，用这些AI工具来帮助我们学习是个不错的选择。Ethan Mollick教授还给出了一个他认为比较好的“自动导师”提示：

　　传送门：

　　[1]https://www.jonstokes.com/p/stable-diffusion-20-and-21-an-overview（Stable Diffusion使用指南）

[2]https://www.pcworld.com/article/540080/how-to-use-discord-a-beginners-guide.html（Discord使用指南）

　　[3]https://huggingface.co/spaces/society-ethics/DiffusionBiasExplorer（观察图片生成偏见）*

　　[4]https://www.oneusefulthing.org/p/a-quick-and-sobering-guide-to-cloning（Ethan Mollick用照片生成视频）

[5]https://chat.openai.com/share/afe54a2d-0ad0-4166-b1aa-9a5394deff66（用Code Interpreter做数据可视化）

　　[6]https://chat.openai.com/share/ec1018ec-1d86-4160-b587-354253c7d5cb（AI导师提示）*

　　参考链接：

　　[1] https://www.oneusefulthing.org/p/how-to-use-ai-to-do-stuff-an-opinionated

　　[2]https://twitter.com/emollick/status/1680586569617481728?s=20

原文链接：https://mp.weixin.qq.com/s/2iIiyuI8DMUbioH8Y1r0PQ

电子技术应用专栏作家量子位

« 上一篇：斯坦福博士独作！大模型训练速度再翻倍，还官宣加入明星创业公司当首席科学家

» 下一篇：GPT-4V被曝离谱bug：突然执行神秘代码，空白图片读出打折信息，网友们都看呆了

量子位

电子技术应用专栏作家——量子位。追踪人工智能新趋势，关注科技行业新突破！

大模型挑选指南来了！涵盖六种情况下的选择方案，为你匹配最佳模型｜来自沃顿商学院教授

作者

标签

量子位

电子技术应用专栏作家——量子位。追踪人工智能新趋势，关注科技行业新突破！

大模型挑选指南来了！涵盖六种情况下的选择方案，为你匹配最佳模型｜来自沃顿商学院教授

作者

标签

关注微信公众号