对于我来说,我一直保持的追求有三点:技术、快乐、财富。因此,从此三点出发,记录过去一周,我所看到的,值得分享的内容,每周五把欢乐送达。
技术
1、视频分析数据集
现在,清华大学和美图开源了教程类行为视频数据集COIN(COmprehensive INstructional video analysis),内含11827条教程类视频,涉及日常生活12个领域里的180个任务的视频内容。
所谓教程类视频,一般都集中在美食、美妆和家装DIY等领域。比如,美妆博主教你化妆、美食博主教你做披萨,都属于教程类视频的范畴。
美图表示,COIN为业界规模最大、最多样性的教程类视频数据集。
以后,在复杂场景下视频动作时序定位、视频行为分析与理解问题的研究中,不妨试试这套数据集。
数据集的视频信息以JSON格式存储, 可以自行解析下载,并且COIN方也提供了网页的数据标注工具。
项目主页:点击查看
数据集项目地址:点击查看
标注工具项目地址:点击查看
2、微信公众号排版编辑器
平时用Markdown写笔记,想在微信公众号发布这篇笔记,如果没有好用的排版工具,就需要手动编辑,长期编辑很痛苦。
Github用户lyricat发布了wechat-format工具,解决了这个痛点。也可以使用在线编辑工具,编辑后直接将固定样式的结果粘贴到公众号编辑器即可。
项目地址:点击查看
3、Pytorch扩展库
随着人工智能发展,很多人都听说过机器学习、深度学习、卷积神经网络这些概念。但图神经网络,却少有人提起。
卷积神经网络和图神经网络有什么区别?
卷积神经网络研究的对象是限制在Euclidean domains的数据。什么是Euclidean data?Euclidean data最显著的特征就是有规则的空间结构,比如图片是规则的正方形栅格,比如语音是规则的一维序列。而这些数据结构能够用一维、二维的矩阵表示,卷积神经网络处理起来很高效。
但是,我们的现实生活中有很多数据并不具备规则的空间结构,称为Non Euclidean data。比如推荐系统、电子交易、计算几何、脑信号、分子结构等抽象出的图谱。这些图谱结构每个节点连接都不尽相同,有的节点有三个连接,有的节点有两个连接,是不规则的数据结构。
最近,开源了一个叫PyTorch Geometric,简称PyG的Pytorch扩展库,里面聚集的算法就是26项图网络研究代码。
如果对图神经网络感兴趣不妨看看这个项目。
项目地址:点击查看
4、DeepFashion2数据集
DeepFashion2是一个时尚数据集,包含了来自商业购物商店和消费者的49.1万张图片,里面涉及13种流行服饰,共计80.1万件服饰,并且每一件都有标注标签,例如类别、角点、边界框、风格等。
项目地址:点击查看
5、Graph Embedding
网络表示学习(Graph Embedding,也叫Network Embedding)是一种将图数据(通常为高维稠密的矩阵)映射为低微稠密向量的过程,能够很好地解决图数据难以高效输入机器学习算法的问题。了解图嵌入能帮助理解图数据的处理过程,拓展思考问题的思路(传统ML基本都是table类型的数据)。
Github有个项目就是针对网络表示学习的教程,包括算法原理讲解和代码复现。
项目地址:点击查看
6、S³GAN
GAN网络一直很火,从近期的CVPR产量中便可看出。2019年的CVPR High-Fidelity Image Generation With Fewer Labels提出了一个S³GAN网络,生成的图像更加逼真。
看下FID(Frechet Inception Distance)评分指标,分值越低,就表示这些照骗,越接近人类认识里的真实照片。S³GAN是8.0分,而之前的BigGAN是8.4分。
同时,S³GAN一个优势在于只用了10%的人工标注数据。而老前辈BigGAN,训练所用的数据100%是人工标注过的。
不过目前S³GAN的pretrained model并没有提供。
项目地址:点击查看
7、模拟登陆
看过我网络爬虫教程的朋友对于模拟登陆应该并不陌生,网络爬虫作为数据获取的手段之一,经常一道的一种问题就是有些数据需要模拟登陆后才能获取。
Github用户CriseLYJ发布了一个名为awesome-python-login-model的开源项目,这个项目介绍了如何用 Python 登录各大网站,并用简单的爬虫获取一些有用数据,目前该项目已经提供了知乎、B 站、和豆瓣等 21 个网站的登录方法。
当然,这些代码是作者收集的,不排除有一些代码需要调试才能跑通,网络爬虫代码时效性弱一些也属正常。
项目地址:点击查看
快乐
1、分享迷惑
2、好朋友对话不用打字
财富
今天聊聊货币基金吧,什么是货币基金?
货币基金是投资货币市场的基金。
好抽象啊!
那换个说法:
普通人去银行存钱,手里拿着几万或者十几万,拿号、排队、一看当期的利息3%,正犹豫存不存的时候,发现对面银行柜员正笑眯眯地看着自己:您还存吗?
潜台词是:不存我叫下一位了!
如果是土豪去存钱呢,拎个几千万,往贵宾室一跷二郎腿,对面业务员也是笑盈盈地看着你:您要存多久呢?要是觉得利息太少了的话,我们给您来个量身定做的大额存单吧,您看要不要考虑一下?
这就是差别,对普通人来说的“一大笔钱”,在银行眼里其实是蚊子腿,真正大笔资金才有议价权。
所以,货币基金就应运而生了!
哦,原来货币基金是把很多人的钱集合起来,再存到银行去啊!
你可以这么理解,但实际上,货币基金还会投资于:国债、票据、同业存款等安全系数高,收益稳定的产品中。
货币基金没有风险吗
既然货币基金都是投资于这些安全系数高的产品中,那货币基金是不是稳赚的?没有风险吗?
货币基金风险很小,但不代表没有风险。
历史上有三只货币基金曾经出现负收益的情况:
2006年6月8日的泰达荷银货币基金(现在叫“泰达宏利货币A”):
2006年6月9日的易方达货币A:
这两只基金之所以出现负收益,是因为当时正值新股密集发行期,很多人将原本放在货币基金里的钱赎回,用来申购新股,造成了当天的巨额赎回现象。
基金经理为了应付大规模赎回,不得不抛售手中的债券,正好当时又碰上债市低迷,于是便出现了亏损。
最近的一次货币基金负收益出现在2016年的7月18日,兴业鑫天盈货币A:
这只基也是因为出现了大规模赎回现象。
上文不是提到过,货币基金会集合大家的钱,去存到银行做一个相对高息的大额协议存款吗。
遇到这种大规模赎回,基金经理就不得不中止部分协议存款以应对流动性压力,但这部分提前支取的金额只能按照活期来算,活期利息哪有协议利息那么高呢,所以就出现负收益咯。
不过,大家不用担心,出现这种负收益现象的概率很小,而且大多都是因为短期的大规模事件导致货币基金的收益异常,长远来看,货币基金仍然是一种风险很小,非常安全的理财产品!
货币基金的两个衡量指标:
七日年化收益率和万份收益
七日年化收益率:
是货币基金最近7天的平均收益水平,比如某只货币基金的7日年化收益率是4%,就是假设这只货币基金是按照过去7天的挣钱速度换算出来的一个收益率。
但真正一年过后,收益率是不是4%,还不一定。
万份收益:
就是基金公司每天公布的,当天每一万份基金的收益金额。因为货币基金都是一元一份,所以万份收益就是你一万块钱每天可以获得的收益。
七日年化收益率越高的货币基金就越好吗
因为每天的万份收益变化较大,所以大家一般会拿七日年化收益率的数据来对比两只基金。
那意思是七日年化收益率越高的货币基金就越赚钱吗?
并不是!
前面在说货币基金的负收益的时候,大家知道大额赎回会对货币基金的短期收益有比较大的影响。
反之,短期内赚到大钱,也会对货币基金的短期收益产生较大影响。
很多基金经理为了配合货币基金的宣传需要,会在短时间内将手中收益高的产品集中抛售,造成货币基金短时间内的7日年化收益率达到很漂亮的数字,比如6%,甚至更高。
当你被这漂亮的数字吸引,而开开心心地把钱放到这只货币基金的时候,小二想起了江湖上流传的一句话“出来混,终究是要还的”,这只基提前透支了它手中的好牌,后续的收益一日不如一日,而你却还在傻傻地等着他回来的那一天……
来源:
https://cuijiahua.com/blog/2019/03/life-21.html