对话Agent案例学习中心

通过实际案例学习对话Agent开发,掌握不同场景下的应用技巧

全部案例
游戏场景
网页生成
图片生成
PPT制作
动画创作
程序代码
截图还原
多模态识别
任务思维链
游戏场景

游戏生成:1句话即可生成emoji消消乐小游戏,游戏也能用嘴快速开发

让LLM大模型使用html代码,轻松快速开发小游戏,只要你想得到,它就能实现!甚至是小朋友也可以快速开发游戏了。

查看案例 →
网页生成

网页生成:智体OS官网——使用deepseek-V3对话agent实现快速生成和定制

开发能够理解用户需求的网站生成的对话Agent,1句话即可轻松完成网站开发任务

查看案例 →
图片生成

图片生成:生成有特点的人脸形象,并在多个场景中重复使用(一致性保持)

采用QWen2.5-VL实现对源人物人脸特征的分析,实现了人物特色特点抽取,从而在生成AI图片中保持人物特征的连贯性

查看案例 →
PPT制作

智能PPT生成助手:生成智体OS V3.0产品发布的PPT(产品发布、融资类PPT一句话快速成稿)

通过对话方式收集需求,自动生成结构完整、设计专业的演示文稿。

查看案例 →
动画创作

对话式动画制作工具:1句话快速制作地理学科的冷暖气流作用下形成降雨的动画(教学动画)

通过自然语言指令创建和编辑简单动画,支持场景描述和角色动作控制。

查看案例 →
程序代码

代码生成助手:poplang智体编程的LLM大模型中文编译器(agent)

根据需求描述生成poplang代码片段,并能理解错误信息提供修复建议。以便在agent-tools的function-calling中使用poplang进行准确的调用代码生成。

查看案例 →
截图还原

图生代码:由app截图生成html网页代码(兼容手机端、PC端)

从网页截图、app截图、设计稿截图、手绘图,识别内容并描述为精准的UI的JSON格式描述。最终经LLM大模型还原为可编辑的HTML/CSS代码。

查看案例 →
多模态识别

图像内容问答系统:盲人导航、手机内容智能识别等

上传图片后,Agent能够识别内容并回答相关问题,支持多轮对话。使用多模态LLM大模型,精准分析图片内容,并用于各种对话agent开发。

查看案例 →
任务思维链

复杂任务分解助手:《嘴炮地图》驾车导航

将复杂任务分解为可执行步骤。案例中将用户提问的导航任务拆解成思维链、思维树的分析结果,以便调用agent-tools完成各种任务(借助dtns-api和mcp-server,可以与现实世界完美融合的智体agent系统,支持对话式快速开发迭代)。

查看案例 →