SupIR是一个通过增加模型规模来提升图像修复能力的技术,SupIR能够根据文本提示进行智能修复,提高图像修复的质量和智能程度。SupIR是一种突破性的图像恢复...
Lumiere是谷歌研究院团队开发的基于空间时间的文本到视频扩散模型。Lumiere采用了创新的空间时间U-Net架构,该架构通过模型中的单次传递一次性生成视频...
DiffusionGPT,字节跳动开发的由LLM驱动文本生成图像多合一系统,专门设计用于为不同的输入提示生成高质量的图像。其主要目标是解析输入提示并确定产生最优...
GPT-SoVITS,一个声音克隆和文本到语音转换的开源 Python RAG框架,只需1分钟语音即可训练一个自己的TTS模型。完美克隆你的声音!GPT-SoV...
LibreChat,一个增强版的ChatGPT程序,一个免费开源的聊天机器人平台,集成了多种 ai 模型,例如 ChatGPT、OpenAI、BingAI、Pa...
Motionshop,ai角色动画工具,通过先进的视频处理和3D渲染技术,Motionshop能够自动检测视频中的人物,并替换成3D卡通角色模型,生成有趣的AI...
PhotoMaker,利用多张照片作为身份ID,获取人物特征,然后根据描述生成符合描述的人物照片创造出一个新的、个性化的人物图像。PhotoMaker也能把几个...
图像上色(Image Colorization)是一项经典的计算机视觉任务,在许多现实世界的应用中具有巨大的潜力,例如老照片修复、电影重制和艺术创作等。给定一个...
Chatbot UI,一个开源的聊天机器人Web UI框架,提供 Openai 的 ChatGPT UI 的改进版本。该工具提供了一个简单的用户界面,具有新对话...
Personalized Restoration,一个面部图像精准恢复和个性编辑技术,Personalized Restoration不仅能复原受损图像细节,同...
QAnything ai是一个本地知识库问答系统,旨在支持多种文件格式和数据库,允许离线安装和使用。您可以简单地删除任何格式的任何本地存储文件,并获得准确、快速...
Jan.ai,桌面客户端是 ChatGPT 的替代品,可在您自己的计算机上运行,并带有本地 API 服务器。Jan 附带了本地优先、AI 原生和跨平台扩展框架。...
ChatGPT-PLUS 基于 ai 大语言模型 API 实现的 AI 助手全套开源解决方案,自带运营管理后台,开箱即用。集成了 ChatGPT, Azure,...
Make-A-Character,通过一句话描述人的脸型、五官、发型特征,即可高效率、规模化地生成具备全栈式美术能力的超写实3D数字人。生成结果包含人头人体,配...
今天,我们发布了稳定版 Zero123,这是我们内部训练的模型,用于生成视图条件图像。与之前最先进的 Zero123-XL 相比,稳定的 Zero123 产生了...
Meta ai最近发布了一项炸裂的技术:Audio2PhotoReal,从音频生成全身逼真的虚拟人物形象。它可以从多人对话中语音中生成与对话相对应的逼真面部表情...
IP-Adapter-FaceID模型利用面部识别模型的面部ID嵌入,可以更准确地捕捉和再现特定人物的面部特征。结合文本描述生成可以生成高度个性化且与原始面部特...
VideoDrafter,一个高质量视频生成的开放式扩散模型,相比之前的生成视频模型,VideoDrafter最大的特点是能在主体不变的基础上,一次性生成多个场...
一个ai自动投递简历的工具,结合chatgpt与rpa技术,实现一键自动寻找工作、根据自己的简历和工作描述生成求职信、发送给hr的全流程自动操作。这是一个完全免...
DreamTalk,一个由清华大学、阿里巴巴和华中科大共同开发的一个基于扩散模型可以让人物照片说话,支持包括歌曲、多种语言的语音、嘈杂的音频在内的各种声音匹配让...
解决ai图像生成中手部畸形的问题 目前的图像生成模型,再生成图像方面已经非常出色,但在生成人类手部的图像时却常常出现问题,比如手指数量不对或者手形怪异。Hand...
腾讯发布多模态音乐生成模型M2UGen 支持图片、视频生成音乐,M2UGen是一款引领潮流的框架,融合了音乐理解和多模态音乐生成任务,旨在助力用户进行音乐艺术创...
DemoFusion,一个开源的 ai 图像重绘增强工具,一个超更高分辨率的图像生成增强工具,通过使用最新的 BSR Gan技术,可以把生成图像的分辨率提高4倍...
AnyDoor,由香港大学、阿里巴巴和蚂蚁集团联合研发AnyDoor,可以将一张照片上的任何物品传送到另一张图片的世界中。AnyDoor项目地址:https:/...