码多多Al智能聊天系統是一款基于人工智能技术的聊天系统。它可以与用户进行自然语言对话,提供各种服务和答案。Chatai的核心技术是自然语言处理,它可以理解用户的...
AnimateDiff是一个能够将个性化的文本转换为图像的扩展模型,一款可以在stable diffusion中制作稳定gif动图的插件,它可以在无需特定调整的...
ProPainter,一键移除视频内的移动物体,一键移除视频水印。ProPainter是一款强大的AI工具,可以帮助用户一键移除视频内的移动物体和水印。它利用先...
TryOnDiffusion是一种基于两个UNet的扩散架构,旨在生成穿在输入人物身上的服装的可视化效果图。该方法能够在保留服装细节的同时,适应显著的身体姿势和...
Animagine XL 3.1,一个开源的文本生成图像动漫模型,通过整合新的数据集,Animagine XL 3.1扩展了对广泛动漫作品和风格的理解,从经典作...
LangChain是一个用于构建基于大型语言模型(LLMs)的应用程序的开源框架。 LLMs 是根据大量数据预先训练的大型深度学习模型,可以生成对用户查询的响应...
我们认为开源 ai 图像、视频生成工具值得有更好的交互体验设计,而不是 WebUI 和 ComfyUI 那样原生的样子。很多人不愿意学习或者参与到 AI 生成这...
Magi模型,可以自动将漫画转录成文字并自动生成剧本,还可以通过识别漫画页面上的面板、文字块和角色,重新排序和关联,输出连贯的对话内容,准确地为每幅漫画生成文本...
Beeble ai和纽约大学一起发布的论文,支持一非常低的成本让人物同虚拟环境的光照相融合,效果看起来非常好。使用 Beeble AI 的 SwitchLigh...
Open WebUI,为大模型提供用户友好界面,支持 Ollama 并兼容 Openai API。特色有直观聊天界面、响应式设计。支持代码高亮、Markdown...
Sora.FM 是用于生成 Sora ai 视频的开源 Web 模板,使用 nextjs 创建。生成视频的接口暂时 Mock,等 Sora API 发布后可快速...
SoraWebui 是一个开源 Web 平台,使用户能够使用 Openai 的 Sora 模型从文本生成视频。SoraWebui简化了视频创建过程,支持在Ver...
OOTDiffusion:一个高度可控的虚拟服装试穿开源工具,可以根据不同性别和体型自动调整,和模特非常贴合。也可以根据自己的需求和偏好调整试穿效果,OOTDi...
notesGPT,一个能够录下你的语音内容,然后自动帮助你把这些语音转成文字,对内容进行总结,创建具有视觉吸引力的文档,并能够添加图像、待办事项列表、图表、链接...
MoneyPrinter,一个自动创建YouTube短视频的自动化赚钱项目,只要输入视频文本MoneyPrinter即可自动产生与之相关的短视频。MoneyPr...
YOLO-World,腾讯ai实验室开发的一个实时目标检测工具,它能够自动识别和定位图像中的各种对象。YOLO-World在速度和准确性方面都优于许多最先进的方...
Boximator 是由字节跳动发布的一种视频编辑工具,它能让用户通过简单的操作控制生成视频中主体的运动轨迹。物体将严格按照用户绘制的位置和路径进行运动。这个工...
在人工智能领域,从语音中创建准确的面部唇部动作一直是一个持续的挑战。然而,突破已经到来——Media2Face。Media2Face是通过音频、文本和图像多模态...
Audio2Face,一款由ai驱动的应用程序,通过语音生成富有表现力的3D面部动画。Audio2Face 简化了 3D 角色的动画,以匹配任何画外音轨道,无论...
WhisperFusion 建立在开源工具 WhisperLive 和 WhisperSpeech 的功能之上。WhisperFusion可以让你和ai聊天机器...
ai Cover是由idoubi艾逗笔开发的一款AI红包封面生成器,利用AI技术根据用户的需求创造独特高清精美的微信红包封面图片。可用于制作精美的红包封面。一般...
StreamRAG,一个视频搜索和流媒体代理工具,StreamRAG 使您能够在 ChatGPT 中与您的视频库聊天并观看视频流。StreamRAG能够在数百小...
DuckDB-NSQL,一个专门为DuckDB数据库设计的文本到SQL的模型,你可以使用自然语言说描述你的需求,它会自动转换成SQL代码,也就是可以使用自然语言...
Diffuse to Choose主要用于虚拟试穿场景。它能够在修复图像时保留参考物品的细节,并且能够进行准确的语义操作。Diffuse to Choose能让...