瞻博网络公司机器学习软件工程师Shruti Jadon的访谈

我们感谢 什鲁蒂·贾登(Shruti Jadon)瞻博网络公司 参加 数据科学访谈系列。 Shruti的这次采访专门针对数据科学的初学者。 Dos和Don’他们需要牢记。 Shruti还分享了她的经验中的一些AI智能之家,这将有助于 you make the right decisions in your 数据科学 journey.  She shared several insights, including:

  • 她关于数据科学的故事
  • 她最好的书推荐
  • 成为一名出色的数据科学家所需的技能
  • 是什么让她充满动力 

机器学习建模只是数据科学家的一小部分’的工作。您还需要软件工程师,数据工程师和研究人员的技能。

什鲁蒂·贾登(Shruti Jadon)

要转移到另一个数据域,需要付出一些努力,但要成为一名优秀的数据科学家,核心概念通常保持不变。

-Shruti Jadon

要成为该领域的领导者,必须知道如何设计整个基础架构,以便ML模型可以成为系统的一部分。

什鲁蒂·贾登(Shruti Jadon)

您是如何第一次进入数据科学的?

我喜欢在应用数学领域工作。所以,当我单身汉’s,我参加了数据挖掘课程,向我介绍了各种用于数据分类的数学模型。我着迷于如何借助编码来减少劳动量。为了进一步探索数据科学领域,我决定继续从事数据科学领域的职业,并加入了UMass Amherst的MS计划。 

您作为数据科学家每天使用的关键技能是什么?您是如何开发这些技能的?

我认为,最重要的是,要成为一名数据科学家,您必须喜欢处理原始数据。机器学习建模只是数据科学家的一小部分’工作除此之外,您还需要软件工程师,数据工程师和研究人员的技能。关于发展这些技能,我们大多数通过阅读书籍,论文和做具有挑战性的项目来学习,而其中一些则是您从经验中学到的。

作为一名专业数据科学家,您当前面临的最大挑战是什么?如何应对这些挑战?

我们面临的主要问题之一是数据短缺问题。在不同的时间,我们会得到未标记的数据,有偏差的数据或更少的数据。解决这个问题的直观方法是雇一个人给他们贴标签,但是我希望那是那么容易。标记有时需要领域专家,在医学图像等情况下,’雇用人员进行贴标非常耗费成本。作为数据科学家,我们需要分析数据,看看是否可以采用其他一些技术,例如新架构,领域适应等,并提供最佳的模型。

机器学习如何改变网络行业?

机器学习通过预测流量,内存利用率和检测异常来帮助许多数据中心优化成本。反过来,这又为企业节省了很多钱,甚至帮助大型科技公司减少了碳足迹。

作为数据科学家,您所从事的业务/行业的领域知识有多重要?您是如何获得的?

拥有领域知识可以帮助您更好地理解业务需求,但是’不是可以’不会在途中被收购。甚至我也曾在制造业,医疗,电子商务和网络等不同行业担任过数据科学家。要转移到另一个数据域,需要付出一些努力,但要成为一名优秀的数据科学家,核心概念通常保持不变。

3个最能概括您如何学习机器学习和数据科学的单词?

  1. 数学理解
  2. 好奇心,
  3. 和很多辛苦的工作。

图书:在您的旅途中,哪些图书对您的帮助最大?为什么?

在机器学习领域开始我的旅程时,我主要提到我在UMass Amherst的课程,例如“统计学习简介:R中的应用“, “亚伦深度学习“, 和 “凯文·墨菲(Kevin Murphy)的机器学习“。这些书帮助我清除了概念上的疑问,并使我能够继续研究论文。

在我的大师之后’s和四年的行业经验以及侧面的一些研究论文,我也写了一本关于 “使用python的动手一枪式学习”。赢了’如果我说错的话,写博客和论文也可以帮助我成为一名更好的数据科学家,因为我必须解释这些概念。

课程:您选择了哪些课程/程序对促进您的数据科学职业做出了重大贡献?

我已经获得硕士学位’于2018年从马萨诸塞州大学阿默斯特分校获得。麻省理工学院的课程为我提供了一般机器学习领域的深刻AI智能之家。

您在过去12个月中引入的最大改进是什么,从而极大地改善了您的工作流程?

我开始详细研究大型机器学习系统。具备基于机器学习的建模知识仅仅是个开始;要成为该领域的领导者,必须知道如何设计整个基础架构,以便ML模型可以成为系统的一部分。

您对今天想要进入数据科学领域的人有什么建议?

数据科学是一个广阔的领域。从数据可视化到建模。即使在建模中,也有多个字段,然后还有各种数据域。一罐’在这一切上都是专家。我将建议即将进入数据科学领域的人们阅读所有内容,但要确保您是其中某些领域的专家,并通过阅读书籍,论文和参加会议来不断更新自己。

是什么激发您从事数据科学工作的?

数据科学是一个新兴领域,各种应用尚待探索。它’它是动态的,每年都有新的研究开辟新的可能性。这个领域是一个进行中的工作,只是在此过程中做出贡献的想法’的建设使我充满动力。

副主编

茶yan 是一位注重细节的创意数据科学家。他是每天的学习者和博客作者,非常渴望分享知识并支持数据科学社区。与他联系 领英 联系并不要’别忘了检查他的 博客。

数据科学|机器学习|科技博客– upGrad

关于Chayan Kathuria

茶yan 是一位注重细节的创意数据科学家。他是每天的学习者和博客作者,非常渴望分享知识并支持数据科学社区。与他联系 领英 保持联系,不要忘记签出他的 博客。 数据科学|机器学习|科技博客- upGrad

查看Chayan Kathuria发表的所有帖子→