Machine learning 中的 validation sample 是属于in-sample 还是 out-of-sample 呀?在CFA考试中很多人在问这个问题,今天小编给你说说!
机器学习(Machine Learning),是研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
machine learning机器学习,就是把收集到的数据分成两组,一组叫training sample,另一组是validation sample。具体是说,把training sample的数据喂(feed)给电脑,让它自己识别学习,总结出一套规律算法。
然后用总结出的算法放到 validation sample (验证样本)中检验,看规律是否成立。
机器学习分为两种 ,一种是supervised,也就是labeled traning data,就是事先认为的给出一些label,比如检验桃子和苹果混合在一起,人为事先给出 检测表面有没有毛,果实硬度 这些label让机器检验;另一种是unsupervised,也就是not labeled,机器自己总结特点规律,比如实际中 银行反洗钱,和垃圾邮件,都是机器自己识别,人类没有给label,此外 机器学习的考点还有,需要人类的主观判断,会出现overfitting问题,以及暗箱操作(black box)。
然后问的 in sample 还是out of sample 中的sample是指training sample 所以 validation是out of sample 的,所以说它就是out-of-sample,如果你在备考中有很多的不懂的知识,可以跟着一起学习哦!