3类生成式AI在实际应用中的问题

自今年3月份以来，各种生成式AI工具层出不穷，有文字生成工具，图片生成工具，视频生成工具，语音生成工具，各种工具极大提高了我们的工作效率。

但是AI工具毕竟是基于数据和模型来生成内容，在实际使用中仍然会出现很多的问题，喵喵这几月频繁使用这些AI工具，梳理了一些生成式AI工具在实际使用中会出现的问题以及常用的解决办法的局限，和大家探讨，希望可以找到更加高效率的解决方法。

一、ChatGPT文字生成工具

ChatGPT是基于OpenAI的GPT架构，是生成式预训练模型，有大量的知识和能力进行自然语言处理，是目前最热门的AI内容生成和对话工具，但大多数人在实际使用过程中仍然会有以下一些问题。

1.数据更新的限制

ChatGPT最新的训练数据截止到2021年9月，所以在这之后发生的事件或最新的知识ChatGPT是不知道的。当我们询问它2021年9月之后的事情的时候，它会提示自己没有2021年9月之后的数据，并给到一些其他的回答。

然而，在实际应用中，我们肯定会时常需要询问当前发生的资讯和最新的知识，如果ChatGPT无法回答，那么对于使用者来说是极大的不便。

之前ChatGPT-4是有联网功能插件的，但是现在这个功能无法使用了，所以ChatGPT又无法回答关于2021年9月之后的内容了。虽然Webchatgpt谷歌插件可以实现联网，但是喵喵在使用过程中觉得还是比较鸡肋的，体验并不是很好，且无法在移动端应用。

2.AI幻觉

AI幻觉，通俗易懂解释就是AI在一本正经地胡说八道，输出一些不正确的、胡编的内容。造成AI幻觉的原因可能是数据训练集的原因，例如数据集缺失或者被压缩，因为ChatGPT是基于数据训练集来训练的，如果之前的训练数据集来自不准确的源材料，或训练数据集缺失特定的推断，那么它就有可能输出缺乏常识或者不合逻辑的推断。

3.缺乏真实经验

ChatGPT可以提供基于数据的答案，但没有人的情感、直觉或真实经验。在处理某些情境、道德问题或感情问题不够完美，并且它的回答是基于对提示词的理解来生成的，所以有时可能会误解含有双关、讽刺或其他非字面意思的问题。

4.冗长或过度解释

ChatGPT有时为了确保信息的准确性，它可能会给出冗长或重复的答案，总-分-总是它的回答结构。要解决这个问题我们可以在写提示词的时候就做好限制，明确要求它以简洁明了的内容回答我们的问题。

5.依赖用户输入的提示词

ChatGPT的回答依赖于使用者的提示词。如果问题表述不清晰，ChatGPT可能无法提供准确的答案。因此，想要用好ChatGPT，提示词的编写变得尤为重要，如果使用者的语言组织能力差，或者没有学习过一定提示词编写结构，那么可能较难得到自己想要的回答，或者使用效率非常低。示例：小红书文案编写提示词模板

二、Stable diffusion图片生成工具

Stable Diffusion是一种文字生成图像的生成式AI工具，它是完全开源，我们可以根据自己的数据集训练自己的模型，以生成自己想要的图片，Stable Diffusion是目前最热门的图片生成工具。但是在实际应用中喵喵觉得还是有一些问题，虽然这些问题都有一定的解决办法，但未达到喵喵想要的便捷和高效。

我们利用Stable diffusion生成图片，图片的风格可以通过大模型或者Lycoris来控制，图片的人物形象可以通过lora来控制，人物的动作可以通过controlnet的openpose，canny来控，图片的质量的可以通过放大算法来控制，但这些插件在应用中依然有一些不足。