全球GEP的数据科学家Jalem Raj Rohit先生采访。

jalem raj rohit.–是全世界GEP的数据科学家。他正在进行数据科学和NLP,他也是一个技术作者。他撰写了两本书和千克和无服务器工程的视频课程。他是Devops的钻石主持人和堆栈溢出的Datascience网站。
它在空闲时间进行开放源。在朱莉娅,Go,Scala,R和Python的修补。

他是技术议员,他就下面提到的以下主题讲话。

  • 20世纪60年代的优雅背后’S Regexp(Foss Asia,Singapore 2017)
  • 了解无服务器架构(Pycon台湾2017)
  • 线性回归–好的,坏的和未罗成(Pydata德里2017)
  • 进入数据科学(Pydata Raipur,IIIT Naya Raipur的嘉宾谈话)
  • 机器学习车间(2小时; IIIT Naya Raipur)
  • 从建立无服务器分布式系统(Devops Days India 2017)了解的经验教训
  • 机器学习研讨会(5.5小时,英里印度营地2017年)
  • 从建立无服务器分布式系统(Velocity Confer)的经验教训(伦敦2017年)[10月’17]

在本文中,Jalem Raj Rohit先生享有他的经验:

  • 如何成为数据科学家
  • 成为数据科学家所需的工具/算法是什么?
  •  利用语言模型在搜索上下文感知搜索之上
  • 他对2015年世界杯的数据驱动预测因素的项目

Q:   什么是数据科学?

数据科学是从数据找到答案的科学。数据科学是关于数据和技术的主要世界。我们学习了物理,化学,数学,我们可以带来这些技术应用数据。它是程序组合,数学和逻辑的组合。

Q:   数据科学中使用的技术是什么?

数据科学中使用了几种技术。最受欢迎的一次是Python,R和Julia(他们是编程语言)。

Python:最好您可以从Python开始。如果您正在为公司工作,或者您想要一些生产力,您可以使用Python。

r: 如果您将成为研究人员意味着你和R一起去,因为R是有益的搜索目的,它在构建包中有很多。大多数研究人员将与R一起使用,但最初是为了理解。如果您来自一个非编程背景,那么您就可以使用Python。

AI时间期刊资源
你学习数据科学吗?

Check out what 图书 帮助20多个成功的数据科学家在他们的职业生涯中成长。

朱莉娅:它是当前的编程方面的新兴语言.

Q:   数据科学中使用的算法是什么?

 数据科学中使用了几个算法 如随机森林,XGBoost,LSTM,CNN等。

Q:   什么工具包在数据科学中使用?

用于做数据科学的工具包主要是关于三种语言(Python,R和Julia)和存在的库。此外,还有分布式计算工具包,如apache spark和它’s a competitor.

Q:   为什么数据科学在即将到来的年份很重要?

卫生行业的数据科学最近是相当颠覆的。使用ML的癌症进展和对其他关键疾病的研究将是期待的事情。

Q:  我们必须学会成为一个良好的数据科学家?

这些是您可以在成为数据科学家中遵循的步骤,

  • Research
  • Experimentation
  • 数学基本(线性代数,差异和几何)
  • Googling技能和获取互联网的答案/帮助
  • 编程能力
  • 假设检测技巧

Q:    您能在研究区分享任何工作经验吗?

我的研究领域是NLP和QUAL,

1.我目前正在努力在搜索上下文知识的搜索方面利用语言模型。无监督的NLP学习是我对NLP世界的兴趣

2.在上班后,ULP对增强量算法的使用情况是我花的大部分时间。

Q:   您能分享您的“数据驱动的预测仪”项目? and How to apply?

我们刮了过去10年的板球比赛的数据,并预测了赢得比赛的团队的概率。

1.它取决于几种组合,包括击球,保龄球阵容,地面,地面类型,家庭/休息游戏。

2.测试并验证了2015年世界杯。


贡献者

编辑人员实习生 

Pandian Saraswathi Yadav工程学院。我对Python,机器学习,AI感兴趣。

贡献者表达的意见是他们自己的意见。
加入AI时间杂志
加入助理编辑

您是否有兴趣分享AI的信息和知识,并与现场中的一些最聪明的思维联系起来?

了解加入作为一个 Associate Editor.

关于Karuppu Samy.

编辑人员实习生  Pandian Saraswathi Yadav工程学院。我对Python,机器学习,AI感兴趣。

查看karuppu samy的所有帖子→