1.我做了个chatPPT(含源码和prompt)
2.AI与PDE(七):AFNO模型的客服客服源代码解析
3.AI辅助编程插件:Sourcegraph Cody
4.腾讯T2I-adapter源码分析(3)-训练源码分析
5.腾讯T2I-adapter源码分析(1)-运行源码跑训练
6.这个网站真的太香了!居然可以免费使用AI聊天工具和“智能AI聊天助手”项目源码!源码源码!搭建!教程
我做了个chatPPT(含源码和prompt)
实现了一个基于AI的客服客服chatPPT工具,此工具能够根据输入的源码源码面试中如何谈源码话题或句子自动生成PPT,包括润色标题、搭建选择主题颜色以及生成所有插图。教程工具原理涉及openAI的客服客服GPT 3.5 TURBO接口、Dalle2以及Python-pptx库。源码源码
GPT 3.5 TURBO接口用于生成PPT结构文本,搭建包括PPT标题、教程页面标题和内容等,客服客服同时根据文本内容选择适合的源码源码情感主题色彩。Dalle2则将生成的搭建文本转化为相应的,Python-pptx库则负责构建PPTX文件。
实现这个工具的关键在于制定合适的提示语,让AI理解用户需求并生成符合预期的PPT。实现过程相对简单,但需要考虑科学上网、openAI接口费用(生成一个PPT费用约在0.1~0.2美元,主要成本来自接口)以及输出篇幅的限制。
使用时需要注意以下几点:
1、确保网络环境稳定,以便顺利使用工具。
2、openAI接口使用需付费,费用主要依据生成数量,一般生成一个PPT的费用在0.1~0.2美元左右。
3、由于AI接口限制输出最多个token,输出篇幅可能会受限。为解决这一问题,建议将用户输入内容分为多个部分,影视源码有哪些每次生成四个左右的主题,将这些主题的回复拼合,最终生成完整的PPT。虽然这样会增加成本,但可以有效解决输出限制问题。
工具源码已提供,有兴趣的读者可自行下载和优化,以满足更多个性化需求。
AI与PDE(七):AFNO模型的源代码解析
本文旨在解析AFNO模型的源代码,帮助读者理解模型细节与主干结构。首先,AFNO模型的主干框架在afnonet.py文件中定义,通过类AFNONet实现。模型的核心功能封装在多个类与函数中,依据代码注释逐步解析。
在代码中,forward_features函数负责模型的核心逻辑,包括patch切割与mixing过程。这些操作由PatchEmbed类实现。位置编码self.pos_embed通过高斯初始化得到,增加模型的表示能力。
关键模块AFNO2d位于代码中,它基于FNO的原理,负责处理输入数据。AFNO2d模块在forward_features函数中通过循环调用,实现数据的转换与混合。
经过数个L layer处理后,模型进入类似解码器的结构,用于将中间结果映射为目标结果。这一过程通过self.head(x)实现,以解决特定分类问题。
本文通过梳理代码流程与结构图,直观展示了AFNO模型的教育客服系统源码工作原理。读者可参考AFNO的GitHub源代码与论文,深入理解细节。后续文章将继续探讨基于AFNO模型框架的其他应用,如FourCastNet。
AI辅助编程插件:Sourcegraph Cody
Sourcegraph Cody插件是一款免费的开源AI编码助手,提供代码编写、修复和自动完成功能,并能回答编码相关问题。Cody获取整个代码库的上下文,生成更好的代码,使用广泛的API、impl和习惯用法,同时减少代码混淆。虽然支持基本的聊天功能,但其专注于解决编程问题,不涉及与话题无关的对话。Cody适用于VS Code等开发工具,安装后需通过Sourcegraph账号授权。
以下是Cody插件的安装和使用步骤:
1. 访问Cody官网获取安装指导。
2. 插件安装后需授权,对于VS Code用户,通过登录Sourcegraph账号即可使用。
3. 对于其他IDE如IDEA,需安装插件后在设置中输入Access tokens。在Sourcegraph官网创建新的token密钥,保存到IDEA的Cody设置中。
4. 使用Cody时,只需输入代码问题或请求解释,如解释源码类的方法。
Cody插件提供免费使用,相比其他非官方插件,其功能和价值较高,适合编程人员作为日常辅助工具。电脑源码查看工具通过集成Cody,可以提高代码开发效率,解决编程问题,推荐给广大编程爱好者和专业人士使用。
腾讯T2I-adapter源码分析(3)-训练源码分析
随着stable-diffusion和midjourney等AI技术展现令人惊叹的艺术创作,人们对AI可控绘图的追求日益高涨。为提升AI图像生成的可控性,Controlnet和T2I-adapter等解决方案应运而生。系列文章将从T2I-adapter的源码出发,深入剖析其训练部分的实现原理。
本篇我们将聚焦于训练源码的解析,通过代码结构的梳理,了解T2I-Adapter的训练流程。
训练代码的运行涉及数据处理、模型加载、优化器设置以及实际训练过程。在第一部分,我们首先设置参数并加载数据,如DepthDataset,它从txt文件中读取、对应的深度图和文本描述。
在模型加载阶段,我们区分了stable-diffusion模型和adapter。stable-diffusion模型加载时,其配置与推理阶段有所差异,如增加调度器参数、提高精度、调整分辨率和训练相关参数。adapter模型的加载则遵循推理过程中的初始化方法,通过构建不同模块来实现。
训练过程中,adapter模型的关键结构包括下采样、卷积和ResnetBlock的米酷完整源码使用,相比controlnet,T2I-adapter的参数更少,没有注意力层,这使得训练更为高效。模型放入GPU后,使用adamW优化器进行训练,同时设置学习率和数据保存路径。
状态恢复部分,程序会判断是否从头开始或恢复训练,设置log信息。接下来,代码进入实际的训练循环,包括条件编码、隐藏状态生成、adapter结果附加至sd模型以及adapter梯度计算。
loss函数定义在模型配置中,采用L2损失来衡量生成图像与给定时间点加噪ground truth的接近程度。训练过程中,loss计算和模型保存都在代码中明确体现。
总的来说,T2I-adapter的训练源码展示了精细的结构和参数设置,确保了AI绘画的可控性和性能。在AI艺术的探索中,每一行代码都承载着技术进步的点滴痕迹。
腾讯T2I-adapter源码分析(1)-运行源码跑训练
稳定扩散、midjourney等AI绘图技术,为人们带来了令人惊叹的效果,不禁让人感叹技术发展的日新月异。然而,AI绘图的可控性一直不是很好,通过prompt描述词来操控图像很难做到随心所欲。为了使AI绘制的图像更具可控性,Controlnet、T2I-adapter等技术应运而生。本系列文章将从T2I-adapter的源码出发,分析其实现方法。
本篇是第一篇,主要介绍源码的运行方法,后续两篇将以深度图为例,分别分析推理部分和训练部分的代码。分析T2I-Adapter,也是为了继续研究我一直在研究的课题:“AI生成同一人物不同动作”,例如:罗培羽:stable-diffusion生成同一人物不同动作的尝试(多姿势图),Controlnet、T2I-adapter给了我一些灵感,后续将进行尝试。
T2I-Adapter论文地址如下,它与controlnet类似,都是在原模型增加一个旁路,然后对推理结果求和。
T2I-Adapter和controlnet有两个主要的不同点,从图中可见,其一是在unet的编码阶段增加参数,而controlnet主要是解码阶段;其二是controlnet复制unit的上半部结构,而T2I-Adapter使用不同的模型结构。由于采用较小的模型,因此T2I-Adapter的模型较小,默认下占用M左右,而controlnet模型一般要5G空间。
首先确保机器上装有3.6版本以上python,然后把代码clone下来。随后安装依赖项,打开requirements.txt,可以看到依赖项的内容。然后下载示例,下载的会放到examples目录下。接着下载sd模型到model目录下,再下载T2I-Adapter的模型到目录下,模型可以按需到huggingface.co/TencentA...下载。这里我下载了depth和openpose。sd模型除了上述的v1-5,也还下载了sd-v1-4.ckpt。
根据文档,尝试运行一个由深度图生成的例子,下图的左侧是深度图,提示语是"desk, best quality, extremely detailed",右侧是生成出来的。运行过程比较艰辛,一开始在一台8G显存的服务器上跑,显存不够;重新搭环境在一台G显存的服务器上跑,还是不够;最后用一台G显存的服务器,终于运行起来了。
接下来尝试跑openpose的例子,下图左侧是骨架图,提示词为"Iron man, high-quality, high-res",右侧是生成的图像。
既然能跑推理,那么尝试跑训练。为了后续修改代码运行,目标是准备一点点数据把训练代码跑起来,至于训练的效果不是当前关注的。程序中也有训练的脚步,我们以训练深度图条件为例,来运行train_depth.py。
显然,习惯了,会有一些问题没法直接运行,需要先做两步工作。准备训练数据,分析代码,定位到ldm/data/dataset_depth.py,反推它的数据集结构,然后准备对应数据。先创建文件datasets/laion_depth_meta_v1.txt,用于存放数据文件的地址,由于只是测试,我就只添加两行。然后准备,图中的.png和.png是结果图,.depth.png和.depth.png是深度图,.txt和.txt是对应的文本描述。
文本描述如下,都只是为了把代码跑起来而做的简单设置。设置环境变量,由于T2I-Adapter使用多卡训练,显然我也没这个环境,因此要让它在单机上跑。而代码中也会获取一些环境变量,因此做简单的设置。
做好准备工作,可以运行程序了,出于硬件条件限制,只能把batch size设置为1。在A显卡跑了约8小时,完成,按默认的配置,模型保存experiments/train_depth/models/model_ad_.pth。那么,使用训练出来的模型试试效果,能生成如下(此处只是为了跑起来代码,用训练集来测试),验证了可以跑起来。
运行起来,但这还不够,我们还得看看代码是怎么写法,下一篇见。
PS:《直观理解AI博弈原理》是笔者写的一篇长文,从五子棋、象棋、围棋的AI演进讲起,从深度遍历、MAX-MIN剪枝再到蒙特卡罗树搜索,一步步介绍AI博弈的原理,而后引出强化学习方法,通俗易懂地介绍AlphaGo围棋、星际争霸强化学习AI、王者荣耀AI的一些强化学习要点,值得推荐。
AUTOMATIC的webui是近期很流行的stable-diffusion应用,它集合stable-diffusion各项常用功能,还通过扩展的形式支持controlnet、lora等技术,我们也分析了它的源码实现,写了一系列文章。
这个网站真的太香了!居然可以免费使用AI聊天工具和“智能AI聊天助手”项目源码!!!
在AI技术日益盛行的今天,许多开发者都在寻找免费且好用的AI工具。我经过三个月的探寻,终于发现了一个宝藏网站——云端源想!它不仅提供免费的AI聊天工具,还有令人惊喜的项目源码可以领取,对于编程新手和进阶者来说,简直是福音!
这个网站近期已正式上线,我强烈推荐的原因有三:首先,免费AI聊天工具和源码的双重福利,对于需要项目实战和提升技能的开发者来说,就像是及时雨;其次,网站的“微实战”版块提供了针对性强、价格亲民的项目实战项目,如商城支付功能,能快速提升开发效率;再次,智能AI工具中的问答功能尤其实用,能帮助解决写代码时的难题。
在社区动态中,你可以找到休息时的轻松分享,而在编程体系课部分,虽然与其他网站相似,但云端源想的提炼知识点设计使得学习更加有针对性。在线编程功能则提供了协作开发的平台,而论坛则汇集了高质量的技术文章,供你参考和学习。
总的来说,云端源想网站不仅提供了丰富的免费资源,还通过实用的工具和学习资源,帮助开发者提升技能,是值得推荐的工具平台。别犹豫,赶快通过下方链接去体验这个网站的福利吧!
2024-11-29 04:341536人浏览
2024-11-29 04:312128人浏览
2024-11-29 04:071902人浏览
2024-11-29 03:202669人浏览
2024-11-29 02:102188人浏览
2024-11-29 02:08655人浏览
1.?ײ?ģ??Դ??2.一般小程序的开发需要多少资金?3.开发一个微信小程序大概要花多少钱?ײ?ģ??Դ?? 体检系统源码PEIS源码,基于C/S架构设计,专为大型体检中心和医院体检科提供稳定、
1.知道补码,如何计算原码2.计算机系统中的补码和原码是什么意思?知道补码,如何计算原码 计算补码的两种方法如下: 算法一:逆运算步骤。以补码为例,首先进行减1操作,得到反码。接着,将反码中除