franztao

Talk is cheap, show me the code.

AI需求上线checkList清单

2022年4月

motivation 为什么要做checklist,人最多关注不超过7个的目标,在复杂度极高的ML系统上,有许多细节,但是这些细节不可能一个人一步确定。 清单革命,每个人都会犯错,分为 “无知之错”与“无能之错”,”无知之错”是不知道而犯的错,这种错可以被原谅;另一种”无能之错”是能力不足而犯的错,这种错是不可被原谅的。此外,团队犯错的几率比个人低很多,因为每个人都有关注的清单点,所以会大...

AI自动化Devops实践经验

2022年4月

起源 写这篇博客的原因,是在做大量AI相关训练中,每当出现指标效果提不上去时,我们常常思考 的角度是优化模型,但是深度学习的模型是黑盒,如何在工业界可控指标效果,我思考的一个角度就是 从AI整体落地的各个环节流程中可量化,而不是期望模型的黑盒效果。 为算法devops每个流程加上可使用的工具 整体概览 Project Management for Machine Learning...

表格结构识别算法概览

2022年3月

简介背景 历史由来 从古老石块上,人类记录信息的形式就有表格的呈现形式 到现在为止Spreadsheets工具来电子化处理表格 价值 表格是各类文档中常见的页面元素,随着各类文档的爆炸性增长,如何高效地从文档中找到表格并获取内容与结构信息即表格识别,成为了一个亟需解决的问题。对表格结构的还原和内容的识别,能帮助计算机更好的理解表格,在教学内容生产、智能解答等场景下,具有非常重要...

每月学习笔记

2022年3月

实验命名习惯 MMClassification 按照以下风格进行配置文件命名,代码库的贡献者需要遵循相同的命名规则。文件名总体分为四部分:算法信息,模块信息,训练信息和数据信息。逻辑上属于不同部分的单词之间用下划线 ‘_’ 连接,同一部分有多个单词用短横线 ‘-‘ 连接。 {algorithm info}{module info}{training info}_{data info}.p...

每月学习笔记

2022年1月

训练可视化工具哪款是你的菜?MMCV一行代码随你挑 深度学习图像分类任务中那些不得不看的技巧总结 api功能要求 文字&公式混合识别 支持同时对图片中的文字和公式进行识别,实现题目电子化 手写体&印刷体识别 支持对印刷体、手写体文字及公式的识别,返回可编辑的 Latex结果 自动定位识别 自动定位图片中题目的位置,提供文字和公式在图片中的位置信息 识别准确率高 基...

《复盘-对过去的事情做思维演练》读书笔记

2022年01月

书本封面 读书笔记 一、什么是复盘 所谓复盘,通过事后重现整个过程,重新审视、思考事件中的行为和思维,从而发现问题,吸取经验,找到根源,总结规律,最终实现能力提升。 复盘的组成,回顾、反思、探究、提升,一个都不能少。 二、为什么复盘 复盘可以帮助我们避免犯同样的错误,固化流程、校验方向,认清问题背后的问题,发现和产生新的想法与知识。除了提升问题之外,它还对提升个人品性和组织性...

每月学习笔记

2021年12月

PET 的可行性: 直接利用现成的 MLM 模型效果如何?(零样本学习1) 用“大量无标签数据”微调现成的 MLM 模型效果如何?(零样本学习2) 用“小量标签数据”微调现成的 MLM 模型效果如何?(小样本学习) 用“小量标签数据+大量无标签数据”微调现成的MLM模型效果如何?(半监督学习) 聚类算法对比 不同的聚类算法有不同的应...

Reinforcement Learning:Dynamic Programming

2022年10月

Background 本小节介绍动态规划的主要目的是通过动态规划来求解得到最优策略$\pi^\ast$,从而使得价值函数最高。当然上一小节中我们已经证明了,最优策略对应的就是最优价值函数。求解方法基本上就是从两个角度出发,1. 策略迭代,2. 价值迭代。 策略迭代可以分成两步,策略评估和策略改进。策略改进为即固定价值函数,并且找到在该价值函数下的最优策略,也就是估计策略评估得出的$V^\...

Reinforcement_Learning_Markov_Decision_Process

2022年10月

Background Reinforcement Learning是一个比较成熟的学科,有着比较扎实的理论基础,同时也是我觉得深度学习中比较难的一个分支。强化学习主要是围绕马尔可夫决策过程(Markov Decision Process,MDP)来进行的。强化学习不同的流派使用的符号是不一样的,而我们这里和强化学习经典之作Sutton的“An introduction to reinfor...

系列33 Flow Model

2022年10月

Introduction 在上一小节中讲到了Latent Variable Model(LAM),VAE。其主要思想就是将隐变量扩充为高维连续的分布,来增强模型的表达能力。而LAM模型中的核心困难是$P(X)$计算不出来,因为$P(X) = \int_Z P(X Z)P(Z) dZ$,而$Z$的维度过高$P(X)$算不出来。而根据Bayesian公...