简单模型揭示了数据的内在规律。而复杂的模型因为表达能力过强,所以无论数据有无规律都能分开数据。
有看影片时间前后的问题(比如看了前7部后过了一段时间又看了3部,这7部和3部不是同一个分布),不能简单的随机取样。
在银行里的资料是经过筛选的资料,没有存储拒绝给客户信用卡的资料。
Scale的时候不能把train和test set一起scale!相当于data snooping
决定model之前不看资料
时间: 2024-10-14 06:37:22
简单模型揭示了数据的内在规律。而复杂的模型因为表达能力过强,所以无论数据有无规律都能分开数据。
有看影片时间前后的问题(比如看了前7部后过了一段时间又看了3部,这7部和3部不是同一个分布),不能简单的随机取样。
在银行里的资料是经过筛选的资料,没有存储拒绝给客户信用卡的资料。
Scale的时候不能把train和test set一起scale!相当于data snooping
决定model之前不看资料