我们感谢 MiguelGonzález-eierro, 高级数据科学家领先 微软,参与本次讨论作为其中的一部分 数据科学访谈系列 并分享几个有价值的AI智能之家,包括:
您是否有兴趣分享AI的信息和知识,并与现场中的一些最聪明的思维联系起来?
了解加入作为一个 Associate Editor.
- 用作数据科学家的关键技能
- 令人兴奋的数据科学突破
- 作为数据科学家的挑战和灵感
- 以低代码和自动机提前前进的路径
我是一个坚定的信徒,我们每个人都出生在一些特殊的倾向和偏好。这是导致我们所谓的东西成为我们的职业的内在声音。
MiguelGonzález-uierro
开始:进入数据科学
你是如何第一次进入数据科学的?
它是在工程学学校的尽头。我在马德里学习工业工程,专业化电气工程。我很快就意识到我不想在电气工程中度过我的职业生涯。在我学习的学校里,他们教导了我们各种各样的科目,如物理,数学,力学,电力,电子,金融,编程等,但是,我最喜欢的主题是自动化。在5年级计划结束时,我们都必须做一个项目,平均会让人们6个月。我选择的区域是机器人和机器学习,尽管我对这个主题很少。
我的项目是一对梯子的小型人形机器人,特别困难,因为机器人必须同步它们的运动并保持均衡。我非常喜欢这个项目,我花了10到12h一天工作。在一个月内,我已经完成了项目并毕业了。稍后,我曾被聘用在同一实验室作为机器人和机器学习的研究人员,我做了博士学位。
反映在我的早期,直到我23岁我找到了我的生活道路,我知道我喜欢数学和物理,而不是文学或历史,但我没有什么特别兴奋的。我发现那个真正兴奋我的区域的那一刻,它取得了整个差异。我是一个坚定的信徒,我们每个人都出生在一些特殊的倾向和偏好。这是导致我们所谓的东西成为我们的职业的内在声音。
如果我们遵循这种声音,我们就会成为我们真实的自我,我们可以在最大程度上发展我们的能力。如果我们拒绝听到内心的声音,请分散我们的注意力,或者通过我们不喜欢的工作来贿赂我们不喜欢以换取轻松的钱,我们只是欺骗自己,并成为我们所召唤的东西的影子。这就是为什么找到一个人的电话是如此重要。对我来说,它是机器人,AI和机器学习。
作为数据科学家的关键技能和挑战
最高挑战之一是有效的沟通。当您在与多个团队和客户合作的公司时,它是能够提供清晰度和简单的关键。\
MiguelGonzález-uierro
您每天使用的主要技能是数据科学家的关键技能,以及您是如何发展的?
我会将技能分为两组,技术技能和人际交往技巧。
技术技能包括编程,机器学习,运营,数据库管理,分布式计算,网络开发和应用研究等。我开发它们的方式是使用T方法。我努力了解所有这些技能,并在那些对我感兴趣的那些地区非常深刻。
我有多种方式在对我感兴趣的地方获得知识。例如,我每两周一次读一篇研究文件。虽然我在日常工作的时候,我确保我努力占用了一些我正在使用的系统,我不会在使用的时候,我不会停止。我学习的另一种方式是 关于一个我喜欢更深入的区域的博客.
教导他人是教授自己的最佳方式之一,所以我用博客开发文章和项目。这是我自己玩的伎俩,创造这些帖子强迫我学习这个主题更深入。此外,一种非常快速的学习新知识的方式是与众不同地知道的人比我更了解。在我用来发展我的专业知识的所有方法中,从专家学习是最佳,最快的最快,而且它在我的生活中得到了报酬。
人际交往能力包括影响,销售技能,营销,公开演讲,指导,有效的沟通和简化。最近,我一直专注于这些领域。我开发这些技能的方式是通过从书籍,播客,YouTube视频和课程获取知识,以及我称之为迭代验证的过程。
迭代验证包括执行一个动作,例如向我的团队提出一个想法或向客户解释一些特定角度的东西,然后获取对动作的反馈,试图获得定量和定性的反馈,然后进行回顾动作,所以我可以验证哪些消息,行动或想法更有效。
我遵循的Meta-Action是我所说的生活优化。我绝对优化我所做的每一个动作。我认为时间是我们拥有的最有价值的资产,所以我真的讨厌浪费它。我经常考虑如何加快任务,我是多任务处理的粉丝,而且我非常仔细选择我可以并行完成的任务,我可以执行哪一天的时间。我为工作使用的另一个伎俩是我的 CodeBase.,其中包含我可以重用的小型代码,加快我的日常工作。
另一个帮助我更快地创建演示的策略是在我所谓的两件事,三件事,四件事等方面具有PowerPoint。例如,甲板三的东西可能有30张幻灯片,每个幻灯片,每个幻灯片都有30个幻灯片,所以如果在演示文稿中,我想展示有3个组件的想法,我可以快速找到我可以使用的设计。
您目前作为专业数据科学家面临的最大挑战是什么?您如何解决它们?
最高挑战之一是有效的沟通。当您在与多个团队和客户合作的公司时,能够提供清晰度和简单的关键。我面临这一挑战的方式是迭代,当正在讨论的想法时,我试图考虑简化它或制作多方能够理解的消息的方式,无论他们的专业知识。
我认为的另一个重要挑战是技术通过。尽管数据科学和AI已经存在了一段时间,但仍有许多公司不明白这种技术如何变革。我相信工作不会被人工智能所取代,我认为使用AI的人将取代那些没有使用它的人。
您在过去的12个月内推出的最大改进是什么,这些改善了很大改善了工作流程?
可能早在12个月的一点,但最有影响因素的方法是我们所召唤的东西 基于证据的软件设计。这是一种基于证据制定决策的方式,而与个人意见或偏好相反,减少了团队讨论,提高了执行性能并提高了产品质量。
它有五个部分:询问一个值得回答的问题,找到最佳证据,批判性评价证据,应用证据,评估绩效。
您如何通过新的发展保持当前?前3名资源?
我使用Mendeley收集并阅读论文和文件,LinkedIn,也许是其他一些来源,以便让JDE和Trello组织日常节目。
数据科学的未来
在过去的1 - 2年中,数据科学中最相关的最相关的突破,以及您认为新兴趋势如何发展?
对我来说是启用自我监督的学习方法,作为基于变压器,BERT(以及来自IT的所有算法家族)的去噪自动化器。我认为自我监督的学习是在未来几年改善AI领域的主要道路。该方法可以打开实时闭环系统的路径开始开发。
大多数当前的AI系统是开环和非实时的,因此机器学习模型在一个相位培训,然后在不同的相位上生产以得分。理想情况下,我们希望系统可以实时运行,以便学习和评分。自我监督的学习是一种简单地利用可用数据的技术,因此它可以启用这些闭环系统。
您认为前进,数据科学实现将变得更低,代码还是没有代码?
我认为是因为趋势是为了简单。当我开始在该领域工作时,在C ++中完成了很多数据科学。最受欢迎的机器学习库之一是OpenCV for Computer Vision,其初始API是在C中编写的,稍后在C ++中编写。我生活在C ++到Python的过渡。这促进了它的采用和发展其他图书馆的发展。
由于低码或缺口工具,我看到简单的一步。他们将提供另一个巨大的采用跳跃。
MiguelGonzález-uierro
通过自动化ML和PAAS服务穿透行业,您认为这将取代定制解决方案吗?
我实际上认为未来将为最高原子可能水平带来定制的解决方案。但是,到达这些目标的方法将通过智能自动化而不是咨询服务。
最后的想法!
有什么激励你在数据科学中工作的?
数据科学,机器学习,AI和机器人是我们一生中的一些技术。对我来说,探索和应用它们是令人兴奋的。
3个单词最汇总如何学习ML和数据科学:
我不明白
副主编
我是联合创始人&基于新加坡的数据科学和AI初创公司的CTO,以及一位机器学习爱好者,他喜欢与人们互动,了解有关人工智能如何塑造组织和人民的生活以及它如何用于优化业务运营。