关于
本文主要面向哪些想了解以及想从事人工智能相关领域研究、工作的入门人士,在踏入这个领域之前,通过3W(「是什么」,「为什么」,「怎么办」)了解一下人工智能的概貌。
人工智能具体是做什么?
目前从事人工智能的有两部分人,一部分在学术界,以大学和研究所教授为代表,另一部分在企业当中,以各种算法工程师为代表。目前来看,人工智能的几个比较热门的主题主要有:
1. 数据挖掘(Data Mining)
2. 机器视觉(CV)
3. 自然语言处理(NLP)
4. 语音交互
5. 自动驾驶
6. 游戏AI
数据挖掘
数据挖掘属于特别古老,而且在工业界落地特别成熟的一个领域了,而且现在几乎每个人都受益于它。数据挖掘机器学习跟早期的数据分析很相似,通过从数据中找到某种规律,用这种规律来改善产品等的用户体验,实现个性化。
具体而言,它的应用场景包括
1. 个性化推荐, 比如各种APP里面的"猜你喜欢","看了又看","为你推荐",淘宝、京东、美团、亚马逊等电商相关的公司; 头条、腾讯等新闻媒体的个性化咨询推荐。https://tech.meituan.com/2018/03/29/recommend-dnn.html
2. 个性化搜索, 你知道吗?即使你跟别人在百度中同时搜索相同的内容,出现的内容和排序结果也是不完全一样的,利用数据挖掘可以实现千人千面的排序来提高用户体验。现在Google、百度、淘宝等搜索都使用了个性化排序,提升用户体验。
3. 个性化广告, 目前你在社交媒体上和网页上看到的绝大多数广告,都是个性化的,比如百度、Google广告、微信朋友圈广告。
4. 打车调度, 滴滴用数据挖掘的方法,对平台上的订单进行分发,提升总体的接单成功率。https://www.leiphone.com/news/201808/7ZbAz8REosn3L8kT.html
5. 外卖配送, 美团外卖用数据挖掘的方法, 估计订单配送时长。 https://tech.meituan.com/2018/12/13/machine-learning-in-distribution-practice.html
6. 智能定价, Airbnb用算法为房东根据时间不同智能地调整价格。https://www.kdd.org/kdd2018/accepted-papers/view/customized-regression-model-for-airbnb-dynamic-pricing
机器视觉/图像处理
机器视觉是指用计算机算法去理解图像,多年以前,普通人唯一能扯得上关系的也只有PS,然而随着近几年的发展,机器视觉方面的应用已经深入到日常的很多方面了。
- 图像处理软件, Photoshop等软件已经集成了很多视觉方面的算法,Adobe公司近几年也一直在投入很多精力研发新的更智能的图像处理算法。
- 自动抠图: https://sites.google.com/view/deepimagematting
- 图像风格转换: https://zhuanlan.zhihu.com/p/26746283
- 图像超分辨重建, 将720p的图片变成4K高清图片: https://zhuanlan.zhihu.com/p/25532538
- 图像识别与检测, 现在到银行办事,或者在APP上认证, 都可以基于人脸识别的方式进行检验。https://faceid.com/
- 自动驾驶中的识别, 需要及时地从摄像头捕获的图片中识别出障碍和行人。https://yq.aliyun.com/articles/228194
- AI相机, 各种美颜算法,瘦脸等算法相比也不陌生了。
- 各种AI换脸, 搜一下 deepfake 有惊喜哦。
自然语言处理
自然语言处理指的是计算机通过算法理解人们日常的语言。我们每天用的翻译工具、输入法等软件都涉及到自然语言处理相关的算法。
- 联想输入法, 现在的输入法越来越智能了,背后是自然语言处理算法的提升,代表公司就是搜狗。
- 机器翻译, google翻译不用多讲了
- 智能问答/客服, 相信你或多或少都用过一些网站的智能客服, 淘宝、京东等电商都有, 一些简单的问题通过这些机器人客服就可以解决。此外,各种聊天机器人和助手,比如Siri要理解你的话,也是先转成文本后,然后通过自然语言处理算法来处理。GMail还搞了一个只能生成邮件回复的工具,背后也是自然语言处理的算法在驱动。
- 搜索引擎, 搜索引擎应该是最成功的应用自然语言处理的商业产品了, 代表产品是百度和Google。
- 垃圾邮件过滤, 这个也是很古老的自然语言处理算法的一个应用场景了,不过现在关注的人不多了。
语音交互
语音交互应该也是近几年火起来的, 从Siri、Google Now、亚马逊 Echo,再到国内各种智能音箱和AI手机助手。目前还处于幼儿期,不够成熟,但未来潜力很大,结合自然语言处理可以搞出很多大新闻。著名的科技导师李开复就是做语音识别的。
- 语音识别, 国内以科大讯飞为龙头,BAT各家也都有
- AI助手/客服, 中国移动跟讯飞合作搞了机器人客服, 各大长的AI音箱。
- 同声翻译, 目前虽然还不成熟, 未来还是有可能商用的。
- 语音降噪/语音合成, 有些降噪耳机中也用到了先进的降噪算法, 语音合成就不必说了, 很多电子书阅读软件都可以体验到, 智能客服输出的语音也是合成的。
自动驾驶
自动驾驶应该是目前的风口行业了, 最早是由Google带起来的, 国内厂商百度跟进,然后一大堆自动驾驶公司冒出来了,很多汽车制造商也加入了竞争。自动驾驶要用到上面几乎所有的AI技术,包括视(机器视觉)听(语音识别)说(语言合成)读(自然语言理解)写(自然语言合成)。
游戏AI
游戏AI随着游戏的诞生就有了,早期的游戏AI很菜,所以玩单机游戏都称之为「虐电脑」,但是现在就不一定了哦。这个标志性事件是从AlphaGo开始的,在这之前AI只能在一些简单游戏上胜过人类选手, 但是从这以后,各种游戏AI横空出世,甚至魔兽这种复杂的游戏AI也出来了。https://www.zhihu.com/question/41176911
人工智能的价值
取代或部分替代人类的工作, 完全替代很美好, 但一般需要很长的过程, 最后也不一定能实现
知识储备与获取
- 数学
- 高等数学
- 线性代数
- 概率论与统计
- 凸优化
- 数值计算(可选)
- 泛函(可选)
- 计算机
- C/C++/Java (选一门就行)
- Python, AI御用编程语言
- 数据结构预算法
- 数据库基础(SQL要会写)
- 数据挖掘/机器学习, Andrew Ng的公开课就行, 推荐教材 周志华《机器学习》
- 自然语言处理(cs224n)
- 数字图像处理/分析/理解,计算机视觉(cs231n)
- 语音信号处理/识别/合成
- 强化学习(cs234, cs294)
- 相关新闻源
- 爱可可的新浪微博,可邮件订阅
- 新智元
- 机器之心
- reddit, r/machinelearning https://www.reddit.com/r/MachineLearning/
- 知乎「机器学习」相关话题
- 国际会议
- NIPS
- AAAI
- ICML
- CVPR
- KDD
- 研究组:
- DeepMind
- OpenAI
- 实践
- Kaggle比赛 https://www.kaggle.com
- 阿里云天池大数据比赛
个人观点:对未来的展望
未来10年内,会用基本的机器学习算法优化业务问题将成为IT行业的标配, 未来很多工作会部分地被AI替代, 目前推荐、搜索和广告基本上已被完全替代了