选自towardsdatascience 作者:Kajal Yadav 机器之心编译 编辑:小舟、杜伟
在人工智能的大潮中,机器学习项目琳琅满目。哪些项目是兼具代表性和实用性的呢?近日,一位名为 Kajal Yadav 的作者列出了 8 个经典的机器学习项目,实用又有趣。目前已在 medium 上获赞 1.7K。
这 8 个项目的主题包括情绪分析、自动摘要生成、情绪检测、老照片修复以及深度学习生成音乐等。这是一个非常敏感的话题,以至于被认为是一个迫切需要解决的问题。全球有超过 2.64 亿人正在遭受抑郁症的折磨。抑郁症是全球致残的主要原因之一,也是全球疾病负担中极为重要的一部分。每年有 80 万人自杀而死。自杀是 15 到 29 岁人群的第二大致死因素。遗憾的是,抑郁症的治疗往往延迟、不准确甚至完全不起作用。基于互联网的生活为改变早期抑郁症治疗服务提供了机会,尤其是在年轻人群中。正如 Pew 研究中心(Pew Research Center)指出的那样,有 72% 的人使用互联网。社交网络上发布的数据集对许多领域都非常重要,例如人文科学和大脑研究。但是,仅依赖专业领域的支持还远远不够,并且显式方法论也并不奏效。所以,通过分析社交媒体帖子中的一些标志性语言,我们可以创建一种新的深度学习模型。这种模型可以较传统方法更早地使人深入了解自身心理状态。图源:Unsplash,摄自 Aksh yadav。该项目的想法主要是基于从体育比赛视频中提取出准确的摘要。一些体育网站能够给出比赛的亮点。关于提取式文本摘要任务,已经出现了各种各样的模型,其中以神经网络的性能最佳。通常,摘要生成指的是简要介绍文章的信息,着重传达事实类信息,同时突出文章重点。自动创建游戏视频的轮廓带来了一项挑战,即找出游戏中精彩的环节和亮点。因此,人们可以使用三维卷积网络(3D-CNN)、递归神经网络(RNN)和长短期记忆网络(LSTM)等深度学习方法,同时也可以先通过机器学习算法将视频分成几个片段然后应用支持向量机(SVM)、神经网络(NN)、k-means 算法等。图源:Unsplash,摄自 Antoine Dautry。在所有问题中,手写数学表达式识别是计算机视觉研究领域令人困惑的问题之一。借助于图像处理技术加持的卷积神经网络(CNN),我们可以通过手写数字(handwritten digit)和数学符号来训练手写方程式求解器。开发这样的系统需要用数据训练机器,使其熟练学习并做出所需的预测。图源:Unsplash,摄自 Sebastian Herrmann 。曾经遇到过这样的情况,每个人都只想看到摘要而不是报告的全部内容。上学的时候,我们会花费很多时间准备报告,但老师只有时间看摘要。摘要已经成为解决数据过多问题的一种无可替代的有效方法。从对话中提取信息具有很好的商业和教育价值,这可以通过捕获具有对话结构的统计、语言和情感方面的特征来解决。通常来说,手动将报告浓缩为一个汇总摘要要花费很多时间,但是用自然语言处理(NLP)来做就会简单很多。用深度学习生成文本摘要能够理解整篇文章的上下文,对所有需要快速生成文档摘要的人来说真是太方便了。图源:Unsplash,摄自 Alireza Attari 。人脸是人体的重要组成部分,它对于了解人的心理状态尤为重要。用人脸识别检测心情并推荐歌曲不仅可以省去歌曲手动分类的麻烦,而且有助于根据人的情绪特征生成适当的播放列表。关注公众号 逆锋起笔,回复 pdf,下载你需要的各种学习资料。人们倾向于根据心情和兴趣听音乐。所以,我们可以创建一种应用程序,通过捕获面部表情,识别出用户的情绪并推荐相应的歌曲。计算机视觉是一个跨学科领域,这一领域的研究致力于在计算机上对数字图像和视频做高水平的理解。计算机视觉组件可用于通过面部表情决定用户情绪。文章《20+ Emotion Recognition APIs That Will Leave You Impressed, and Concerned》中介绍了 20 多种有趣且实用的情绪识别 API。文章链接:https://nordicapis.com/20-emotion-recognition-apis-that-will-leave-you-impressed-and-concerned/从开普勒等太空飞行器拍摄的图像中找出宜居的系外行星图源:Unsplash,摄自 Nick Owuor 。在最近十年中,对超过 100 万颗恒星进行了监测,以识别正在凌日行星(transiting planet)。人工解释系外行星候选者的工作量巨大,并且容易出现人为错误,其后果难以评估。卷积神经网络适用于在嘈杂的时间序列数据中,以比最小二乘策略更高的准确性来识别类地系外行星。以原始方法修复受损照片是非常耗时和痛苦的。因此,我们可以通过深度学习找出所有的图像缺陷(如裂缝、划痕和孔洞),并且借助于图像修复算法,我们还可以根据像素值轻松地找出缺陷,以复原老照片,并为老照片着色。图源:Unsplash,摄自 Abigail Keenan。音乐是一种变换频率的曲调。因此,自动音乐生成(Automatic Music Generation)是一个用最少的人为调整作出一小段曲子的过程。最近,深度学习工程(deep learning engineering)已成为程序化音乐生成的最前沿技术。以上就是本文作者分享的 8 个重要的机器学习项目,并且在每个项目的最后还提供了相关推荐文章,读者可以参考阅读,希望可以从中受益。原文链接:https://towardsdatascience.com/8-ml-ai-projects-to-make-your-portfolio-stand-out-bfc5be94e063