franztao

Talk is cheap, show me the code.

数据增强

2022年10月

在训练数据拆分上评估数据增强,以增加高质量训练样本的数量。 Intuition 通常希望通过数据扩充来增加训练数据的规模和多样性。它涉及使用现有样本生成合成但真实的示例。 拆分数据集。想首先拆分数据集,因为如果允许将生成的样本放置在不同的数据拆分中,许多增强技术会导致某种形式的数据泄漏。 例如,一些增强涉及为句子中的某些关键标记生成同义词。如果允...

利用版本控制管理代码、数据和模型

2022年10月

利用版本控制管理代码、数据和模型 对代码、数据和模型进行版本控制,以确保 ML 系统中的可重现性。 intuition 学习了如何对代码进行版本控制,但还需要跟踪和版本化其它几类非常重要的工件:配置、数据和模型。重要的是对所有内容进行版本控制,以便可以随时重现完全相同的应用程序。将通过使用 Git 提交作为用于生成特定模型的代码、配置和数据的快照来做到这一点。以下是需要合并的关键元...

推荐系统

推荐系统 推荐系统 推荐系统  推荐系统是什么   推荐系统是帮助用户发现内容,克服信息过载的重要工具    信息过载: 信息过载是信息时代信息过于丰富的负面影响之一。指社会信息超过了个人或系统所能接受、处理或有效利用的范围,并导致故障的状况。   它通过分析用户行为,对用...

如何思考数学问题

如何思考数学问题 如何思考数学问题 1.理解问题  证明... 推算...  求...(值) 求所有的....(值)  是否存在... 2.理解题目所给出的信息 3.理解题目所要求的目标 4.选择恰当的符号(由那门数学基础建模) 5.用选定的符号表达你所知道的信息 6.对问题稍作修改  1...

Theory_table understanding

theory_table understanding theory_table understanding 陶恒franz 2022-11-13 ...

Theory_prompt

theory_prompt theory_prompt 陶恒franz 2022-11-13 ...

Note_张潇雨 个人投资课

得到:张潇雨 - 个人投资课 得到:张潇雨 - 个人投资课 陶恒franz 2022-10-30 ...

Network optimization

network optimization network optimization qos method  比例路由  提高缓冲能力  流量整形  资源预留  准入控制 metric  业务可用性  时延  bandwidth  &n...

Methodology_好好学习天天向上

methodology_好好学习天天向上 methodology_好好学习天天向上 陶恒franz 2022-11-13 ...

How to think and summary algorithms problem

how to think and summary algorithms problem how to think and summary algorithms problem 输入,输出 时间,空间复杂度 点  技巧点  优化点  拓展点  新知识点  易错点  本质点 &...