186. 新建文件夹：扩散模型

    重生之AI教父正文卷186.新建文件夹：扩散模型除去孟繁岐在华国时推行的人脸识别方法已经大行其道，最近他在医疗影像诊断分析领域的一系列工作，其实也已经在加州的圈子里率先展开了试用。

    那句话怎么说来着，【获得了几百名教授一致通过】。

    尤其是湾区附近两所最顶级的高校，斯坦福和伯克利两个派系。由于他们在人工智能比较没落的时候仍旧坚持研究，因而也对这些迟到的果实感到格外珍惜。

    斯坦福肿瘤方向的教授刘勇使用了这系列算法之后，感到十分惊奇，这电脑明明一两年前才刚刚学会分辨什么是猫，怎么现在突然就这么生猛了？

    尤其是比较难一点的病症，自己带的几个学生分辨起来一看就是十几二十分钟，这东西倒好，几秒钟就能给出一个答复。

    为此，他私下里和孟繁岐聊过两三次，大概了解了原理，也为他协调提供了不少数据作为支持。

    有一次，刘勇教授向孟繁岐询问道：“既然人工智能已经可以对图片中病变的种类，区域和轮廓都做出如此准确的分析判断，那能不能帮忙把医嘱或者文字分析也给写了？”

    孟繁岐听完顿时语塞，没想到刘教授接受新事物的速度还挺快，已经做上白日梦了这是。

    他只得实话告诉刘教授，别说语言和图像的结合的多模态了，目前语言模型本身都仍旧是一个相对急需突破的领域。

    想要实现他需求的功能，恐怕还得几年。

    斯坦福的其他医学教授，比如杰佛雷主任等人则非常看好孟繁岐阿尔法fold项目，尤其是杰佛雷，他曾经担任二十多个临床药物研究的首席调查员，因而非常能够理解这种蛋白质分析能力的价值。

    杰佛雷是个大脑门，有点胖乎乎的中年男子，满面红光，对待学生十分热情。

    在得知孟繁岐的阿尔法fold项目很是缺乏高质量的蛋白质数据之后，也非常积极踊跃地提供了协助。

    总体来说，斯坦福医学派系对本校学生的的突破相当热情，借助着加州这两所顶级高校的影响力，孟繁岐的成果正在慢慢地向外辐射。

    只不过大量数据的准备，并不是区区几天就可以有显着成效的。

    即便加州相关方面的教授集体支持，积累数据的速度仍旧远远要比孟繁岐所想的慢不少。

    阿尔法fold项目的正式开启时间，至少要往后延一到两个月。

    因而在开学前的这段时间，孟繁岐的蛋白质分析大计不得不进入了一段时间的停滞期。

    “技术提的太快，就是会碰到这种问题。”孟繁岐有些无可奈何，别说很多领域还来不及接受和消化自己做出的能力提升。

    这些地方原本积累的那点数据在新的技术面前，完全不够看，数量实在太少了。

    即便他们能够及时调转车头，开始进行优质数据的积累和标注，肯定也是要一段时间的。

    数据跟不上，孟繁岐即便理论再好，却也难做出足够好的效果，不足以让人信服。

    “我也算是搞了好个月的应用技术了，现在数据上要等一两个月，看来是时候做点基础工作，为以后铺垫了。”

    时隔多月，孟繁岐也算是终于被迫静下心来，有了足够的时间做一些基础的理论方法，而不是急于做产品又或者是变现。

    毕竟，往后的技术不管是AI生成语音，图像还是文本，目前的这些技术理论还有不小的缺陷和问题。

    他计划最近开发的，便是后来非常火热的一款图片生成技术，StableDiffusion的基础部件，diffusion原理。

    这是后来许多优质生成技术的基石，非常适合现在做准备。

    扩散模型，这个比较不明觉厉的名词，虽然后来知晓原理的人很少，但很多人却都听过这个名词多次。

    从AI绘图软件生成的作品打败一众人类艺术家，斩获数字艺术类冠军，到后来Midjourney，、Imagen、novelai等国内外平台遍地开花。

    越来越多的人都曾点开过相关网站，尝试让AI描绘脑海中的画面，又或者是进行局部的修改调整。

    有以文生图，各种神秘咒语召唤古神的，也有以图生图，闹出各种神奇笑话的。

    2022年，AI绘画，AI生成图像，在短短几个月内数次进步。

    每一次的进展突破都带了了rou眼可见的提升，远超人类的想象。

    就在22年年关左右的时候，大家都还在嘲笑AI绘图是什么东西，实在太过丑陋了。

    结果三个月后就发现事情似乎没有那么简单，AI开始大量产出各种波涛胸涌的绘图，这吸引了相当一部分人们的注意力。

    那时不少人还在开玩笑说，虽然AI画得不行，但你真别说，它对题材的把握还是非常不错的嘛！水平不够，题材来凑。

    等再过三四个月，到22年底的时候，AI绘画的水平和能力已经无人再去争议了。

    这回大家主要争论的点又变了，变成了AI绘图究竟是不是抄袭，AI水平和画师究竟谁更强。

    抛开到底谁更强这件说不清的事不谈，单从大家争论的这些内容就能看出，AI绘画的能力确实进步得非常之快。

    “平心而论，在AI生成这件事情上，GAN生成式方法是让大家走了弯路的。”

    虽然孟繁岐的GAN生成式办法在学界广受好评，建立起了很高的学术声誉和知名度，FaceGAN的假脸生成效果也颇为惊艳，但最终真正让AI制图火起来的还是扩散模型。

    “GAN办法生成对抗的模式固然让人感到惊为天人，但两个网络彼此对抗学习，毕竟还是非常麻烦的事情。”孟繁岐思忖了一下，现在的大难题，数据是一方面，计算设备则是另一方面。

    本来自己提前发布技术，显卡就已经很不够用了。目前用GAN去针对某一个特定的事物，比如FaceGAN只做人脸还是比较可以的，但想要从文本直接生成，那难度可就大了。

    扩散模型的原理其实并不难，主要是通过对照片添加噪声，然后在这个过程中学习到当前图片的各种特征。之后再随机生成一个服从高斯分布的噪声图片，然后一步一步的减少噪声直到生成预期图片。

    代码写起来不是那么困难，不过若是写成论文，琢磨其中的原理，那里面的数理逻辑和推导，够孟繁岐喝一壶的。

    “数学这方面....这两天找韩辞和付院长他们帮帮忙吧，好久没怎么跟他们联络了。或者也可以请辛顿和李飞飞指点一下，这两位都算是我的导师。”涉及数学问题，找数学专业人才自然放心。

    李飞飞和辛顿虽然不是数学出身，但李飞飞有物理背景，辛顿更是领域内教父，两者在这方面实力想必也很强。

    新建了文件夹，孟繁岐刚准备开始工作，却隐约感觉哪里不对，自己好像遗忘了什么事情。

    半晌才想起来，自己的倒霉室友唐璜今天要到斯坦福附近来。

    “这大半年过的，差点忘记我自己还是个学生了。”

    高强度研发了三四个月的孟繁岐，感觉时间好像已经过去了一年多。

    正好唐璜来了，就给自己放几天假吧，来了也有几周了，却一直没有好好逛过斯坦福的校园。