过去一段时间,我用AI做了什么
1.内部测试环境的短信接收工具

在内部测试产品的时候总是要接受虚拟手机号的短信验证码, 之前的方式是通过访问一长串的 URL,并复制其后缀来完成。 频繁测试的时候会非常麻烦,于是我尝试用 AI 制作了一个浏览器插件,每次只要点击两下即可获得验证码。 这个小工具算是我的第一次 AI 编程的尝试。
2. 一个 DISCORD 的 PROMPT 翻译工具

这个工具的契机是因为当时 MIDJOURNEY非常火爆,我自己也每天花大量时间去尝试制作各种风格的 AI图像。 但是把中文 PROMPT翻译成英文是一个非常非常繁琐的过程,需要在翻译工具和 DISCORD 之间来回切换。 为了提升效率,我制作了这个工具,只需要将中文输入完@下机器人就会自动进行翻译。 这个过程和之前相比更加复杂,也更加有成就感。 当时各大模型的编程能力一般,我需要自己去翻阅很多 DISCORD 的 API 资料,以及思考整个工具的结构,然后让 AI完成对应的工作。这对于非研发出身的我,成就感满满。 关于这个工具的详细介绍:https://mp.weixin.qq.com/s/0GhzOerTSKCCLB9EJDBhhw (不过这个工具现在我已经下架了)
3. 一个基于浏览器的笔记插件:BIGNOTE

由于每天大量的工作都是在浏览器上完成,所以我非常期望可以有一个便捷轻便的NOTE工具帮助我随时记录东西。 当然会有人说,苹果的备忘录/FOLOMO 等笔记工具不可以吗? 当然也可以,当时我自己的习惯是,零碎的/临时的笔记会记录在一个地方,比较重要且确定的才会真正记录到备忘录里面去。 所以我开始构思自己制作一个 CHROMOE 插件来承担这个作用。 这个工具是目前为止,我只自己制作的所有工具中,使用时间最长的。 从制作完成后,我一直到现在都还在使用。 但是最大的问题是,这是个“单机”模式的工具。 1.笔记基于浏览器保存在本地。 2.云端同步,可以绑定 NOTION 的数据库,这需要用户自己来进行操作。 3.提供了批量导出和导入的功能。 这也就造成一个结果,即这个工具目前只有我自己在使用,毕竟没有谁会为了一个没有完整账号和云端同步功能的笔记工具而买单。
4.一个 CHROME 翻译插件:OKBOT

在积累了前面的 AI编程经验后,我开始尝试制作一个工具,并正在上架谷歌商店。 还是从个人的日常需求入手,这次我尝试制作一个翻译工具。 1.支持一件翻译 X 上的推文。 2.可以基于当前页面和 AI 进行交流 3.可以在任意页面划线翻译。 当然,以上翻译功能全部基于大模型。 最终还算顺利,在修改和 DEBUG了无数版本后,终于是上线了谷歌商店。 插件的下载地址:https://mp.weixin.qq.com/s/9Ehp-W8uIwFtDYYjgHlP9A
5. 智能的 TTS 生成器

在使用AI 的过程中, 给我最大的感受是其可以大大提升考虑。 这个工具是我在工作中的又一次尝试,原因是我需要大量的配置并编写很多剧情。 所以我尝试使用 AI 来制作了一个自动生成的工具。 其作用就是可以基于我设定的规则(人物/角色/天气/语言模式等)自动生成对应的引言描述(即 TTS 文案) 当然这次的尝试也让我看到了 AI目前的局限性, 即:大产生大量内容后,你会发现依然会有那极小部分的内容需要人工进行修饰和调整。 所以,是否使用工具完全取决于工作量和对内容的标准要求。
6. 一个儿童故事机 KIDStory

51 节日的时候,我在家里开始尝试构建一个给儿童讲故事的工具。 思考的设定如下:
- 基于WEB 浏览器完成全部的流程。(没有尝试手机APP,是因为我想更快的完成主流程的编程。)
- 可以基于设备的摄像头进行视觉识别。
- 可以讲识别到的物体进行故事创作(编写一个小故事)
- 可以将故事转变成TTS 讲述给正在使用的用户。 目前这个工具已经完成到了 STEP 3,可以精准的识别用户手中拿的物体,但是我还没有完成转换 TTS的部分。 这是我目前最有意思的一次尝试。
##小结: 过去两年,我通过使用AI工具,从零起步,制作了这些小工具,从简单的浏览器插件到复杂的交互应用,每一个都源于日常工作和生活的痛点。这些尝试不仅大大提升了我的工作效率,还带来了满满的成就感,让我这个非编程背景的人感受到AI的强大潜力。当然,AI并非万能,它在处理精细内容时仍需人工干预。未来,我希望继续探索AI的应用,制作有意思的探索。 如果你也有类似需求,不妨试试用AI来实现自己的想法——它会让你惊喜! 如果也爱鼓捣,欢迎一起交流共同进步。 以上就是我过去两年的 AI 编程流水账,期望对您有所启发。感谢阅读。