创始人Michael Campbell访谈& CEO of 格洛西卡

迈克尔·坎贝尔(Michael Campbell)是 格洛西卡, a company that applies Artificial Intelligence to aid language 学习ing.

坎贝尔先生还是该委员会的成员 AI for 教育 2019计划,这是一项AI Time Journal计划,旨在确定并强调人工智能技术在教育中最有益和最具影响力的应用。

In this interview, Mr. Campbell shares insights on how AI can be leveraged in the world of language 学习ing to meet every student’的需求以及他对教育的未来的看法,因为新工具正在改变课堂上语言教学的方式。

这次采访是 在人工智能教育倡议 2019中精选。


格洛西卡 Q&A

你的背景是什么?

我会形容自己是一个从中壮成长的人“pain”。我在东亚的一个外国国家以移民身份成立了一家公司,领导着一支使用世界上最复杂的书写系统的外语团队,这是我经常必须阅读财务报告和文件的原因。 ,我必须建立一家公司而没有适当的银行,信用卡,信用卡或任何外部投资或贷款的渠道,因为我基本上是在那个地方开始成年生活的,之前没有其他任何联系。我必须依靠连接并将很多东西放在一起才能使其正常工作。

My life is structured around building more 疼痛 into it, so I do a variety of mental 和 physical challenges. I run 10km up 和 down a mountain every morning. I “enjoy” practicing a variety of complex piano concertos in what free time I have in the evenings. I try to 学习 an indigenous language every other year or so. And I’我是Wim Hof这样的鼓舞人心的粉丝。一世’稍后将参考处理“pain” in education.

绝对是更容易的方式来创建公司,更容易的方式来成功以及更容易的赚钱方式。但是我相信,我们通过逆境变得更加强大和更有韧性,而且我一直以这种方式过着我的生活。

幸运的是,我’从事语言业务。

I’ve been surrounded 通过 languages ever since I was a child, mostly English, Russian, German, 和 Italian. By the age of 20, I had 受过训练的 as an interpreter 和 translator of Chinese. As I got more exposed to opportunities over the next couple of years, I phased out of it 和 ended up doing a variety of consulting projects for companies in the Greater China region for about a decade, projects of which included solving bottlenecks in company processes, international marketing strategies, cross-culture communication, fluency training for the salesforce, etc 和 gained a lot of valuable experience during this time.

I love 学习ing for the sake of 学习ing 和 I read widely on a variety of topics. But human communication, specifically how real world events get turned into human expression has always been of particular interest, 和 deep understanding of it has allowed me to pick up languages that contain highly different structures. 

我已将这推到了极致,并获得了几种土著语言,其中一种特别出色。当我在2010年学习Thao语言时,只有5名母语为Thao语言的人,这就是为什么我更加急切地要求他们精通该语言。今天,这些演讲者都去世了,我’m剩下的只有少数非母语人士之一。语言学家声称,这种通用语言已有5000多年的历史,反映出一种非常古老的语言家族(称为Austronesian)的一些已知特征。仅在Thao中,我就能找到将语言与泰语,夏威夷语甚至希腊语联系起来的词根,尤其是““I”,这也许是世界上最古老的单词。该语言缺少用于现代发明的大量单词,但是其动植物词汇量非常丰富,并且与之相关的信息很多,但是不幸的是,其中大多数可能已被带到了坟墓,并永远消失了。

我仍然很重要,每两年左右出去学习另一种土著语言,无论我记得还是迷失了它。重要的是冒险和经历,其中的故事以及您遇到的人。学习本地语言就像解决数独难题一千倍之多,而且带来的收益也更大。但是对于每种语言,难题变得更小,更容易解决!

人们惊人地类似于世界各地。如果只有世界睁开耳朵,真正听取人们的声音,并试图了解表面上看起来有所不同的人,那么世界上的仇恨就会减少很多。人类最独特但又统一的特征之一就是我们的语言天赋。我们所有人都拥有它,每种语言都能够表达我们在地球上共同经历的全部境界。没有一种语言比另一种语言更好,并且土著语言可能充满了许多主流语言逐渐消失的各种复杂性。

How was 格洛西卡 started? What is 格洛西卡’s mission?

One of the problems in language pedagogy, whether that be in the analog or digital sense, is that there is a major lack of organisation in the intermediate stages of language 学习ing to produce results in fluency. This lack of organisation manifests in random approaches 和 methods that each teacher develops individually.

Interpreters have built a great system for training fluency with extremely high efficiency. Unfortunately, very few people know about these 学习ing methods. 格洛西卡 was born out of the idea of making such a system that allowed me to improve some of my more passive knowledge languages, something that I could do in my free time without too much extra effort, but producing similarly efficient results.

在许多东亚国家,我经常看到个人的工作词汇可能为500-1000个英语单词,对英语语法有基本的了解,或者他们在上学时会被动记住的内容,但绝对没有能力开口说话。这是由于他们遇到该语言的频率极低。实际上,个人之间的发音差异很大,从可怕到可以通过。没有一个以英语为母语的人会听不懂这些只会讲单个英语单词的人,因为发音会损害他们的意图。

但是,通过对他们已经知道的知识进行一些培训,您可以将这个人变成只需要几次练习就可以交流的人。即使他们的发音相同,’能够将他们所知道的内容输入句子中,即使说母语的人也可以开始理解其含义,即使发音无法治愈。什么时候可以换人’沟通的信心,他们沟通越多,他们的发音就会越好。他们’我将开始听到自己的声音,并能够更好地理解他人。它’是积极周期的第一步,可以使他们更有效地沟通。

因此,使用外语进行交流的关键是能够以母语者能够理解的方式将句子组合在一起。发音,词汇甚至语法都是次要考虑因素。原因是练习由母语者制作的结构良好的句子已经在句子中正确使用了词汇和语法。下一步就是通过模式识别简单地训练它们。

为了整理句子,我们作为这种系统的设计者必须具有强大的句法框架。因为有了这个框架,我们 ’能够弄清楚以任何一种语言出现的模式,并且从这些模式中您可以进行语言习得。没有这些模式,一切似乎都是随机的,什么也不会发生。这可以比喻成住在国外或以目标语言观看几十年来的所有电影而没有取得任何进展。随机噪声等于随机结果。

Deciding to do this at scale at 格洛西卡, we needed to solve the 硬est problems first, solving for the most challenging pairs of languages, 和 then using a cascading set of solutions for all other languages below that. Several years ago I developed our syntactic framework based on first-order logic that describes real-world events, 和 we now use AI to map all the patterns back to the myriad surface varieties of languages. For example, whenever we’面对新的语法挑战,我的测试之一是如何以广泛不同的语言(例如Dyirbal(澳大利亚的一种土著语言)或Pirahã(巴西的一种土著语言)或多种语言中的任何一种来表达世界上通用的语言。因为如果通过测试,那么我们’我们可能找到了正确的方法。所有其他语言都属于该级联。

Adding lots of languages to 格洛西卡 is important not because English speakers want to 学习 lots of languages. We can’猜不到人们来自哪里或他们在哪里’为了使事情变得不那么复杂,我们的平台是开放式的:我们拥有的一切对所有人都可用。它’之所以重要,是因为人们会说多种语言,并且希望使用自己的语言来学习英语,法语,中文或其他主要语言。一旦我们的系统中有了孟加拉语这样的语言,这意味着说孟加拉语的任何人现在都可以在我们的系统中学习日语,中文或阿拉伯语。他们之所以这样做,是因为他们经常前往这些国家工作。

但是比语言更重要的是实际的语言内容。我们’在添加和定义与特定行业有关的内容以及为这些行业专门设计产品方面,现在重新开拓。

Who are 格洛西卡’s customers 和 how do you create value for them? What challenges do they face, or will they face in the future, that 格洛西卡 can help them overcome?

我们的算法’内置于2019年产品发布中的方式从很多方面使人们受益,而我每天’m发现使这些类型的不同客户受益的新方法。

格洛西卡 is one of the best tools that a language teacher or tutor could ask for. Especially in terms of curriculum development. 格洛西卡 solves curriculum problems all happening deep in the database 和 is tailored for every student. 格洛西卡 is able to read the complexity of a vast number of sentences, written in any of the languages we support, 和 sort it for complexity in a way that a student can acquire that data one step at a time without being overburdened. For example, we can take a whole novel or a textbook in any 学科 in any language, 和 our algorithms can sort all of that data from the easiest sentence to the 硬est in terms of comprehension. This is because 格洛西卡 focuses on language 和 communication, rather than the 学科 matter. So it universally applies to any 学科 matter. We just haven’t had the chance to start endeavouring into other 学科 matters yet. But this is ripe for opportunity to engage with other pioneering companies in other fields of education. Bill Gates just mentioned in a June 2019 interview at Stanford that “reading in general”并建立这样一个“agent”可以像导师一样帮助学生的问题,是目前最大的未解决问题之一。盖茨和其他在这些领域开拓的人往往认为这些问题是“science” or “math”问题而不是语言问题。它’后者比前者更多。

For teachers 和 tutors of language in particular 和 most importantly, their students practice on 格洛西卡 daily 和 have contact with their teacher once a week. That whole week of practice culminates in an awesome session with the teacher where the student has a higher rate of engagement, more conversational use of the target language, 和 where the teacher can also help answer questions that grew from curiosity, exposure, 和 practice of the language over the past week.

Additionally, since 格洛西卡 has a variety of business tools in place for teachers 和 organisations, 格洛西卡 can supplement their income 和 even give them more sustainable income over time as students come 和 go. One way is 通过 combining 格洛西卡 into their set of services, 和 they can track the progress of all of their students from the interface. The other way is 通过 partnering with 格洛西卡 和 making commissions from sales through their websites.

格洛西卡’s 2019产品发布为教师和管理人员提供了更多有关学生正在学习的内容的责任制,尤其是在他们使用多少种语言方面’在句法模式和词汇方面,他们对每个项目的记忆力如何,以及哪个项目特别困难。我们’正在努力将机器学习应用于我们的算法,以便他们可以预测最远的时间向学生提出一个问题,在这个问题中他们仍然很有可能正确回答,这建立了无尽的积极强化,但意味着他们’在学习上取得了很大的进步。然后针对每个单个用户为数据库中的每个项目量身定制这些内存衰减率,以便我们可以分析大型数据集中最困难的项目,并允许其影响排序算法。这意味着随着时间的推移和更频繁的使用,学生不仅可以改善分类,’成功率提高了,但是冗余也从系统中删除了,从而提高了效率。

Tell us about the 格洛西卡 team.

截至2019年中,我们’重新完全专注于我们的R&D团队驻扎在台湾台北。这是我们的语言学家和开发人员一起解决各种问题的地方。该公司作为实验室,我们’re always exploring 和 testing 和 solving 硬 problems.

我们的语言团队主要由来自大学系统的学者组成,因此我们与这些团队一起进行了多个学期的项目。这些项目涵盖特定学科,例如语法,语义,词典,语音学和语音学。拥有一种或多种外语的知识很不错,但是我们总是聘请这些学科中的杰出技能与计算机技能配对。这就是所有AI发生的地方。

在解决许多公司职能中的大量问题时,算法是如此通用,我认为’对于创始人或CEO理解算法设计很重要。这就是我大部分时间所花的时间。

我设计并集成了我们所有系统的算法。这些算法中只有一部分结合了机器学习。我们的主要算法之一采用了所有语言学算法的结果,而语言学算法又包含ML,按复杂度对数据进行排序,为用户过滤数据,然后将结果传递给用户。随着用户学习的越来越多,越来越多的内容被过滤掉,这适应了每个项目中每个学习者的难度和记忆力。

最后,我们的开发人员团队致力于将我们所有的算法设置为代码,并将后端系统与前端接口链接起来,这些前端接口可以在各种设备上同步和运行。

没有首席运营官的谢娜·陈(Sheena Chen),就没有这一切都是不可能的。谢娜·陈(Sheena Chen)自成立以来就戴着很多帽子,并帮助公司平稳运行,承担着人力资源管理,生产团队管理,重新设计整个生产线的各种角色。 ,建立我们的营销工作,建立与客户,员工的行为准则以及与公司外部进行沟通,最重要的是,担任产品经理的角色,传达我的所有想法,弄清用户界面,与开发人员进行沟通,以及将这些想法变成可行的产品。

人工智能教育&A

当今教育系统面临的主要挑战是什么?人工智能技术如何帮助解决或缓解它们?

One of the biggest challenges is curriculum development. In other words, students rely on textbooks 和 the order in which information is presented to build a framework to understand complex 学科s. 那里’s debate about how this is done. Many teachers take liberty to what chapters are presented or taught, often constrained 通过 schedules 和 deadlines, but also confined 通过 their own individual strengths in the specific 学科 matter. Then there’与学生的复杂互动。维持健康的教室环境有时需要心理学学位。为所有学生提供高效,准确的结果可以比喻为在战区建造纸牌屋。

也许我们的“definitions” within the 学科 matter are not the best for comprehension. I have examples from language 学习ing, 和 I believe there are many more waiting to be discovered across other 科学s.

一个很好的例子是“subject” 和 “object”是很多语言都无法做到的一个非常可怕的范例’坚持。即使是英文,“the food is cooking”对它的真实世界相当误导。它没有’t mean that a carrot or some other piece of food is standing at the stove cooking dinner. This is an example of unergativity appearing in English as it lacks the ergative 代理人. So the 学科 和 目的 paradigm doesn’t really mean a real 学科 or real 目的 the way we like to “define”他们。使用划时代性定义语言与现实世界的场景非常吻合,并且很好地解释了什么 大多数老师喜欢打电话“规则的例外”. I don’t accept “规则的例外”. “Exceptions” means you’可能以错误的范例进行教学。在像格鲁吉亚语这样的半格言语言中,我们的句法框架仅根据我们的动词分类准确地准确预测了格鲁吉亚语语法中应在何处出现和不应该出现可发生性标记。例如,使用带有和格和格或所有其他标记的语言。那里’当句法语义算法实际上准确地预测并可以将所有这些动词归类时,学生没有理由必须记住所有带有和格的德语动词“beneficiary”角色模式,学生可以通过“intersocial” topic of these verbs. The algorithms figure this out without the need to 定义 German grammar anywhere in our systems. This is because human languages actually pattern themselves off of real-world events in predictable ways, 和 that has been shown to be true from mainstream languages to indigenous languages the world over.

Defining the grammar is 硬er than detecting the patterns. That’这就是为什么全世界那么多’s languages’语法写成博士学位论文!因此,通过一些奇迹,阅读语法或教科书的学生将能够对这些模式应该匹配的真实世界进行逆向工程,并使他们流利?我们’我们已经看到全世界几乎100%的失败。 

这些论点经常涉及识字问题。许多教育工作者认为,懂流利的法语比说流利的英语更为重要。我认为,既然现在获得流利程度和读写能力的努力已经达到均衡,那么就将流利性放在第一位,因为它的奖励更大,并且可以在收购过程中同时实现读写能力。

传统上,流利的学生会根据自己的动机来选择其他方法来做到这一点。

AI不是’t magically going to give everybody the motivation to 学习. But it will perhaps give us an alternate way of approaching a 硬 problem. We believe that students who are motivated in reducing their effort 和 finding more efficient ways to acquire a language, will use AI to enhance their own 人类智慧 (HI), 和 that’s the role that 格洛西卡 plays.

如今,人工智能在教育领域带来了哪些主要机遇?

解决语言学中的问题具有广泛的影响,因为我们’re solving problems in all of the human communication. And education relies on communication to 学习.

教育的前提是我们向学生介绍新句子’从来没有听说过,看过或读过。这些句子的构成方式必须是“n+1”,换句话说,就是可理解的输入:90%的数据易于理解,而10%是可以在句子上下文中理解的新内容。

但是,当由于无法在其他地方接受教育,缺少词汇或缺乏基本概念而出现在课堂上的学生的句子理解率不到50%时,教师将面临无法克服的负担。学生无法学习,落后于其他学生。这导致恶性循环,可能导致毁灭性生命。绝不应期望任何学生学习或接受低至50%的学习率。

另一方面,您拥有快速的学习者。那些认为90%的人太光顾了,更喜欢70%到80%的人,因为他们承受了在更少的数据上获得更大学习量的挑战。我知道我’这些爱这样的人之一“pain”,但这正是世界上大多数人讨厌的东西。他们不’t want any 疼痛 in their 学习ing. So this is why identifying the threshold of 疼痛 in 学习ing is important to delivering a better solution. 

For example, machine 学习ing can start with basic assumptions that a user’s 疼痛 threshold is above 90%, then adjust it over time as the user picks up the pace 和 the threshold is lowered, but never crossing that threshold 通过 more than a percentage point.

Just as there are less 疼痛 ful paths one can choose in building a company, I believe AI gives more people a less 疼痛 ful path to 学习ing. Somebody needs to go through the 疼痛 of building the solution, however, because the solution is not easy. Many of the problems we face every day in the company are NP 硬 problems. The solution is extremely easy to check, but automating to that solution is extremely difficult 和 AI can only assist in limited ways.

Take, for example, Python spaCy. It can only help us detect with a less than optimum level of accuracy the split syntactic collocations in a sentence. And we have to 硬 code a lot around it in order to tease out the non-subject-object paradigms that we require. It’确实存在这样的工具很棒,但是’了解它们对特定用例的局限性同样重要。

有时候’当公司抛出大量数据以查看机器可以做什么时,这很有趣“learn” from it. I don’t truly believe this is the way to solve 硬 problems. Perhaps you can do this with the right frameworks set up, but how can we trust that companies have gone through the “pain” to figure out the frameworks? The last thing we want is self-flying airplanes falling out of the sky no matter how 硬 the pilots try to stop it.

我经常看到有关口语的下一轮革命的广告,这种设备可以为您翻译。当然,我手机上的Google翻译功能相同。但是,大多数情况下,使用翻译器是我用来增强人的能力的工具。我从中学到东西,然后我学到了什么’我已经学会了在其他地方使用。在紧急情况下可能会很棒。但是我不’不想依靠翻译者来做所有事情。在您的身体中拥有外语交流的能力是非常有益的体验,我只希望更多的人能体验到这一点。 

机器翻译有其局限性。要正确使用,需要向MT提供正确的句子结构,以从中挑出正确的语法结构。大多数人不’不知道该怎么做,这当然对机器学习很有帮助。但是人们说的很多东西都会得到“lost in translation”. 那里 are too many dependencies in human speech, whether anaphora, cataphora or otherwise that can lead an MT astray. The only way to speak accurately through MT is to restructure your own speech like that of a robot, everything clearly demarcated 和 定义d unambiguously, 和 your MT will work wonders. AI is closing the gap of course, but the amount of data required to close the gap just makes one wonder…人类的大脑功能强大得多,并且可以用很少的数据在很短的时间内完成很多工作。我可以提取一部分数据,并按照学习顺序将其排序给一个人,然后给该人其他语言的礼物’一生。与培训MT正常工作相比,这需要更少的时间和更少的数据。人工智能需要正确定位以增强能力“Human Intelligence”并接管我们生活中所有平凡的任务。

AI不是’t smart like humans are. If AI were so smart, it would have thought about language education already, created a company on its own 和 released a solution to the world already. But no, we rely on people to solve these problems, start companies, organise teams, 和 create solutions. 那里fore, we need smarter people, solving 硬er problems, 和 stronger 人类智慧. It’s 硬 to say whether AI will ever replace the entrepreneur.

教师如何为AI驱动的教育做准备?

Focusing on pioneering 人类智慧 (HI) with AI assistance is the priority here. How far can we take the human brain in solving more complex problems, 和 how can AI assist us rather than trying to replace us? Continuously solving more complex problems is how we can evolve during our own lifetime, 和 I’希望看到本世纪的平均HI远远超过20世纪最聪明的人。那里’没有任何理由比解决解决难题所需的记忆力强。它’s absurd to memorise Pi or vast amounts of data unless these are tools that you can access 和 use in real problems. Basic 数学s standards, like multiplication tables, are a must, but more ingraining the habits of using tools (AI, calculators) 和 finding the solutions quickly, which then become a new internalized grammar that we use to solve ever more complex problems is the only way we’将使下一代成为功能更强大的HI。

在接下来的5-10年中,您在哪里看到AI用于教育?

那里 are two things I’我很兴奋:语音和视频。

Bringing video to our platform means that we can train more interpreters for the deaf, in any sign language around the world, at the same time empowering the deaf to 学习 spoken languages through our script training interfaces.

那里’在不久的将来,我们可以利用语音和视频技术做很多事情。一世’m very excited about the applications of GAN 和 what kinds of 硬 problems we can solve using it.

以下的轶事也值得一提:几年前的一段视频传播了一个视频,当时一名挪威男子大叫他的车,呼唤音乐播放列表,而这辆车的反应是除了自己想要的一切外,做了一切,导致他放弃了愤怒。 。他的英语口音对AI来说是完全无法理解的,但对于英语使用者来说也不难理解。

许多大公司破解了识别用户需求的问题’的语音输入,但仅在一定标准偏差之内。就个人而言,会讲多种中文—世界其他地方所说的方言—我的智能手机虽然只能说正确的口音,但能听懂普通话,真是令人着迷。’甚至不懂台湾话或客家话。我知道台湾的本地公司正在率先推出这些解决方案,但我怀疑它们是否具有可扩展性。大多数公司针对特定问题构建非常狭窄的解决方案或狭窄的AI。 (因为那个’s less 疼痛 ful, it’更容易,您可以更快地赚钱。)“hard” solution I’d。追求兴趣(肯定需要更长的时间)将是如何理解特定语言组中的各种语言,无论涉及多少语音或句法变化。这意味着“adaptable”在该语言组中遇到的任何新的演讲形式,并且不需要“trained”. For example, a system 受过训练的 on Bantu languages would be able to understand any of a thousand variations (a thousand other languages 和 dialects) within that system the first time it heard it. This, recognising everybody’自己的声音可以被理解,从而使世界上的每个人都能像他们想要的那样变得独一无二!

的使命 AI时间杂志 是泄露信息
和关于人工智能的知识,
的到来和使用AI技术的新机会
造福人类。

关于AI Time Journal编辑人员

的使命 AI时间杂志 是泄露信息 和关于人工智能的知识, 的到来和使用AI技术的新机会 benefit humanity.

查看AI Time Journal编辑人员的所有帖子→