2016-10-18 ML SDE, ML Scientist
1. Amazon seller上传产品的时候需要给category; 如何根据product name, description, brand, 等信息recommend合适的category以及相关的sub-category
2. How to handle unbalanced data
3. How do you train logistic regression, what is the obj function
4. 如何combine多个非常相似的listed products. 比如amazon搜索某一个laptop 可能会返回3个results 但大部分时候其实是一样的东西 只是卖家,描述和图片有些出入
5. when naive bayes is bettern than logistic regression?
6. Overfitting, Cross Validation etc.
7. 简要说一下自己做过跟ML有关的项目,用什么ML方法,数据什么样,多少feature,怎么处理overfitting/underfitting,L1/L2区别,feature selection
2018-9-27
onsite
8. 完全就是根据做的项目问。他会问high level的问题,比如哪个项目是你自己完成并且很有意义的,从产品的角度来说有哪些意义。
哪个项目是和别人,尤其是不同领域的人,合作完成的,那么是如何合作的。再比如ML 的metric是什么(比如AUC),为什么用这个,如果是对客户或者市场方面的人说AUC可能不太好理解,那么用什么metric好一些?
然后会突然教你说一下一些ML的方法比如GBM。另外,因为我面的是Alexa组,会叫你聊聊如何根据语言判别skill。
Skill 我当时理解就是具体的种类,比如game,pizza。比如我问“Alexa,can you suggestion pizza?”它要根据我的位置来推荐我家附近的pizza店。如果我问“Alexa,can you suggestion game?”
它应该问“what kind of game? Video game or something else?” 我说“Video”,它会接着问再具体的东西(RPG?)直到足够详细再给出建议。 那么如何设计方法叫Alexa能够这么问。
2016-11-23
9.建model, 所以出了个题目. 如果做了一个survey, 知道人的姓名身高等等情况, 预测其收入, 怎么建模
10. naive bayes和logistics regression的区别. 说之间有个trade-off, 是什么?
11. 说一个vector只有binary, 用哪个好.
答, 我还是说看情况. 面试官说不看情况, 你只有一次尝试的机会你用什么? 我说如果都是binary的话我会用logistic regression…
12. evaluate performance:
13. regulation
2017-2-8 applied scientist
14. 解釋深度學習的模型, 優點 etc
15. generative, discriminative models 的差異, 舉例
16. 解釋 generative adversarial networks, 讀過論文但沒用過, 大約講一下原理
17. 避免overfitting的方法, regularization, dropout, cross validation, early stopping etc
18. 兩個模型, 分類正確率分別是 80% 與 81%, 可以說81%比較好嗎? 為什麼?
19. weighted accuracy (WA) vs un-weighted accuracy (UA),
如果存在class imbalance, UA才能選出不會biased to big class的模型
(這邊被隨口追問一下怎麼前處理data of unbalanced class distribution: random sampling, class weights etc)
另外要考慮測試樣本數是否significant, test data diversity etc. vis
原文地址:https://www.cnblogs.com/ffeng0312/p/9938263.html