franztao

Talk is cheap, show me the code.

学习笔记

2022年12月

李宏毅老师新鲜出炉的关于ChatGPT的解读视频,非常推荐:Chat GPT (可能)是怎麼煉成的 - GPT 社會化的過程 - YouTube 原文链接:ChatGPT: Optimizing Language Models for Dialogue GPT Introduction 李宏毅老师 GPT3 ppt 模型之大,感官认识如下图说明 模型整体架构 chatGP...

文章如何转载/引用

2022年12月

本站使用“署名-非商业性使用-禁止演绎”协议,文章不禁转载,但需要注明来源于本站,以及注明来源链接,并且不能随意商业使用。 顺便说,本站不禁转载,但是像公众号等具有原创标识的平台,如果你希望以“原创”身份来转发本站文章时,需要私下联系本人,并获得本人授权,否则会尽力追究相关责任。 作为最基本的尊重,请不要将文章进行简单的“洗稿”后作为你的“原创”发表。 当然这只是个参考格式,事实上我也...

DETR

2022年11月

DETR:End to End Object Detection with Transformers DETR训练过程: 第一步用CNN抽特征。 第二步用Transformer编码器去学全局特征,帮助后边做检测。 第三步,结合learned object query用Transformer解码器生成很多预测框。 第四步,匹配预测框与GT框,在匹配上的框里做目标检测的loss。 D...

设计机器学习产品

2022年11月

设计机器学习产品 用于指导机器学习系统开发周期的模板,该模板考虑了产品要求、设计文档和项目注意事项。 概述 在本课程中,不仅会开发机器学习模型,还会讨论以可重现、可靠和稳健的方式将模型投入生产所需的所有重要 ML 系统和软件设计组件。将从为将要构建的精确产品设置场景开始。虽然这是一门技术课程,但最初的产品设计过程非常关键,是区分优秀产品与平庸产品的关键所在。本课将提供如何思考 ML...

机器学习编排

2022年11月

机器学习编排 通过创建可扩展的管道来创建、安排和监控工作流。 Intuition 到目前为止,已经将 DataOps(ELT、验证等)和 MLOps(优化、训练、评估等)工作流实现为 Python 函数调用。这很有效,因为数据集是静态的并且很小。但是当需要: 在新数据到来时安排这些工作流程? 随着数据的增长扩展这些工作流程? 将这些工作流程共享给下游应用程序? ...

特征仓库

2022年11月

使用特征存储连接 DataOps 和 MLOps 工作流,使协作团队能够高效开发。 什么是feature store 让通过按时间顺序查看开发人员在当前工作流程中面临的挑战来激发对特征存储的需求。假设有一项任务需要使用实体(例如用户)的特征来预测某些东西。 重复:孤立地开发特征(针对每个独特的 ML 应用程序)可能会导致重复工作(设置摄取管道、特征工程等)。 ...

机器学习编排

2022年11月

通过为分析和机器学习应用程序构建现代数据堆栈来学习数据工程基础知识。 Intuition 到目前为止,已经可以方便地使用本地 CSV 文件作为数据源,但实际上,transformers数据可能来自许多不同的来源。此外,理想情况下,transformers数据转换和测试流程应该移至上游,以便许多不同的下游流程可以从中受益。transformers ML 用例只是众多潜在下游应用程序中的一个...

学习观第一季【转载】

学习观第一季 学习观第一季 总原则  从有限例子找出规律  压缩信息来预测未知  明确输入输出  重塑大脑链接 运动类  特点   速度快、精度低、容错高   多因素、可并行   例子 (速度快、精度低、容错高, 多因素、...

学习观【转载】

学习观 学习观 时间之矢  信息与熵   定义    熵:某人对某事是哪种情况的不确定性    信息:消除该人对该事不确定性的事物     调整情况概率     排出干扰情况 ...

Note_【openbmb论文速读】第二篇【转载】

🔔【OpenBMB论文速读】第二篇 🔔【OpenBMB论文速读】第二篇 🔗 文章:PPT: Pre-trained Prompt Tuning for Few-shot Learning (ACL 2022) https://aclanthology.org/2022.acl-long.576.pdf ㊔...