数据建模的体会 2012-07-20

  1. 严格的理论基础可遇不可求,在实际操作和真实数据中最容易获得灵感思路甚至解决方案。
  2. 第一次提出的解决方案能够解决哪怕20%的问题都是很好的(该数字被我从50%改成了20%,未来可能会改成10%)。
  3. 理解数据和清洗数据的过程都很必要:不理解就会跳坑,不清洗就是垃圾进垃圾出。
  4. 数字无大小,再少数的异常情况都可能意味着提取数据或建模过程中有错误,不弄清楚不能放过。
  5. 预测性质的建模,千万不要误用含有未来信息的数据,否则就是传说中的骑驴去找驴。
  6. 模型可以不够精美,但是绝对不能有错误,有错误的模型无法自我进化学习。
  7. 越简单的模型越好,是因为平均每个参数p可以使用到的样本n最多,也就是所谓的奥卡姆剃刀原则。
  8. 能解决p>n问题的办法们的确很流行,但是解决p<n问题的办法们并不过时,并且可能更普适。
  9. 在企业尤其注意模型要有落地点,不然再完美的项目规划和研究思路都不能持久。
  10. 没有最好的模型。
  11. (不断补充中...)


Powered by Jekyll on GitHub | ©2016 Meroa | Last modified: 2021-04-28