想要迅速融入一个领域吗?最直接的方法就是了解其中的专有名词。今天,我们今天将用通俗易懂的语言帮你理解这些名词,再结合官方定义,让你进一步加深对领域的理解。我们将快速帮助大家更清晰地了解那些经常被谈论的专有名词。 当然,对于普通人来说,理解简单的解释就已经足够啦!而且,你还可以利用海盐提供的有趣小故事来科普给妹子,增加自己的天分!哈哈哈哈哈 这样一来,大家就不会再因为朋友聊天听不懂或无法理解AI新闻而感到尴尬了~ 本文虽然与实战无关,但完全可以帮助大家在认知层面提升一个Level! 加入我们,一同直击领域内核,不再被专有名词吓到!
本教程爆肝2天,2万宁全程干货,值得收藏反复查阅
阅读时,对照文档左侧的目录层级,思路更清晰
只有干货,坐稳,发车!
痛点
目标导向,我们来快速说一下,不懂AI领域专有名词有哪些痛点,充分理解要学习了解的必要性,从而效果最大化。
1.社交
与懂AI的朋友交谈时,会因为不懂AI词汇而感到难以融入。
2.无法理解AI新闻和文章
在阅读关于ChatGPT或者AI的科技新闻时,不理解专有名词会阻碍获取和理解信息
3.误解AI的能力和限制
不理解专有名词会导致对AI的能力和限制产生误解,如过度夸大其功能或低估其潜力。会误信一些误导性的信息会误解AI带来的负面影响。
4.对AI的恐惧和不安
由于不理解,会对AI产生不必要的恐惧和疑虑5.在工作和学习中受阻
职业发展会受一定的阻碍,已经有一些创业公司开始内部普及GPT,代替劳动力,降本增效了。在工作或学习中需要使用AI,那么不理解AI词汇就会成为一个障碍。
常见AI专有名词
1.什么是AI
大白话理解:
玩过”超级玛丽”游戏吗?是不是发现,那些小怪物总是按照一样的模式移动,比如左右走走,上下跳跳。你只需要找到规律,就能轻松躲过它们,拿到金币。
但是,想象一下,如果游戏的小怪物开始变聪明,它们不再只是机械地走来走去,而是开始观察你的行动,学习你的习惯。它们发现你喜欢从上方跳过它们,于是它们开始向上跳,试图碰到你。或者发现你总是在一个特定的地方等待它们,于是它们开始改变路线,以避开你。这样,游戏就会变得更有挑战性,因为你需要不断地调整你的策略来应对这些越来越聪明的小怪物。
这些变得更聪明,能学习和适应的小怪物,就像是AI(人工智能)技术。它们能学习,能适应,能理解和处理信息,从而使得它们能做到越来越多的事情。这就是AI的魔力所在~无论是帮我们推荐音乐、电影,还是驾驶汽车,甚至帮助医生诊断疾病,AI都在我们的生活中扮演着越来越重要的角色。对照官方介绍:
AI是人工智能Artificial Intelligence的缩写,是模拟人类智能的技术。它让计算机学习和理解信息,像人一样思考.解决问题。AI包括机器学习、自然语言处理和计算机视觉等技术,能帮助计算机执行各种任务,如图像识别、语音识别、自动驾驶和智能助理。目标是让机器变得智能,提供更智能高效的解决方案,改善我们的生活和工作。
2.什么是AIGC
大白话理解
AIGC是基于人工智能技术的所有应用范畴,比如,ChatGPT就是AIGC的应用之一。让我们用一个有趣的例子来理解一下。想象自己有一个魔法画笔,你只需要告诉它想画什么,它就能画出来。现在,如果你的魔法画笔有了人工智能,它就变得更聪明了。你只需要告诉它你想画一个城堡,它就会自己动手去画,而且还会考虑到很多你可能没有想到的细节,比如城堡的形状、颜色,甚至是城堡里的人们和他们的生活。这个聪明的魔法画笔软件,就是AIGC的应用之一
对照官方介绍
AIGC是AI生成内容Artificial Intelligence Generated Content的缩写。是指由人工智能 (AI) 算法自动创作的各种内容,如文章、音乐、图像等。这一技术利用强大的计算能力和大数据学习,使AI能够模拟人类的创作风格和思维方式,从而生成类似人类创作的内容
-旦模型经过充分训练,它就能够根据输入的特定指令或主题,自动创作出相关的内容。例如,当你提供一个话题给AIGC,它可以生成一篇文章或段落,内容可能包含相关事实、观点、甚至创意。
3.什么是GPT(Generative Pre-training Transformer)
大白话讲解
假设有一只超级鹦鹉,它不仅可以模仿你说的话,还可以理解你说的话,并且给出有意义的回答。这就是GPT的工作原理。
ChatGPT就像是一个超级鹦鹉,它通过阅读了大量的书籍、文章和网页,学习了人类的语言和知识。当你向它提问时,它会从它学到的所有知识中,找出最合适的回答。但ChatGPT并不知道你是谁,也不知道它自己是什么。它只会复述它学到的知识,而不会有自己的想法和情感。所以,虽然可以给出很有用的回答,但是它并不理解这些回答的真正含义。
对照官方介绍
GPT,全称为”Generative Pre-training Transformer”,是一种自然语言处理(NLP) 的神经网络模型。它的特点在于“生成预训练”,通过大量的数据预训练,然后再通过特定任务的数据微调。这使得GPT在诸如翻译、问答、摘要等任务上表现优秀,同时也有强大的创作能力,比如写文章、写诗等。简单来说,它就像个超级智能的文字魔术师,能将你的语言需求变为现实
4.什么是chatGPT
大白话理解
上边说的那只鹦鹉,现在被做了一些对话场景的专项训练。更适合于你问我答的对话模式了,ChatGPT就是GPT的个”对话专用版本”的超级鹦鹉对照官方介绍
ChatGPT是一种人工智能语言模型,它是由OpenA开发的。简单来说,它是一种”聊天机器人”,能够理解人类的自然语言,并做出相应回应。与普通的搜索引擎不同,ChatGPT能够进行对话,就像与一个虚拟智能伙伴交流一样。
ChatGPT基于深度学习技术,通过训练海量的文本数据来学习语言的规律和语义理解。它不仅可以回答问题,还能进行广泛的对话,包括提供建议、讲故事、解释概念、内容生成、总结、分类、分类和情感分析、数据提取、翻译,还有很多很多。
作为一个AI语言模型,ChatGPT的用途广泛,可以应用于多种领域。在日常生活中,它可以回答各种问题,提供实用信息,还可以用于娱乐,与用户进行有趣的对话。在教育领域,ChatGPT可以辅助学习,解答问题,为学生提供知识帮助。在客服和支持领域,它可以为用户提供快速有效的解决方案。
值得注意的是,ChatGPT虽然功能强大,但也有其局限性,它是基于已有数据训练的,所以有时可能会给出不准确或不完整的答案。此外,它无法具备真正的情感和创造力,只是根据模式匹配和统计概率来生成回答。
5.什么是自然语言处理 (NLP)
大白话理解
想象一下,你有一个全知全能的朋友,我们叫他”机器人小智”。你可以问他任何问题,无论是课本上的知识,还是天气预报,甚至是明天的午建议,他都能给你答案。这就是因为小智会”自然语言处理”。
自然语言处理就像是教小智如何理解和回应我们人类的语言。它是一种让计算机能选懂、理解、并回应人举语言的技术。当你问边界AI“明天我需要带雨伞吗?“边界AI不仅需要理解你的问题,还需要知道你在问什么是”明天”,什么是”需要”,什么是“雨伞”,以及这些词怎么联在一起成为一个意思。然后,边界AI会去查找天气预报,最后告诉你是否需要带雨伞。
这就像我们学习新的词汇和语法规则来理解和说一种新的语言一样,自然语言处理就是让计算机做同样的事情,只是计算机学习的语言是人类的语言。
ChatGPT就是NLP的具体应用~
对照官方介绍
自然语言处理(Natural Language Processing,简称NLP) 是计算机科学、人工智能和语言学交叉的一个领域。它的目标是让计算机能理解、解析和生成人类语言。这包括理解语法、句法、语义,甚至语境等复杂的语言元素
自然语言处理技术广泛应用于语音识别、机器翻译、情感分析、文本摘要、聊天机器人等场景中。比如,你正在和ChatGPT进行交谈,这就是一个自然语言处理的应用示例。
6.提示词 (prompt) 到底是什么?
大白话理解
想象一下,你和你的朋友玩一个叫做”画出我说的”的游戏。在这个游戏中,你需要描述一个你心中的东西,然后你的朋友需要根据你的描述来画出这个东西。你可能会说:”这个东西是圆的,有一个长长的尾巴,喜欢吃奶酪…”.然后你的朋友可能会画出一只老鼠。在这个游戏中,你说的每一句话都是一个”提示词”,它们帮助你的朋友理解你心中的东西是什么。没有这些”提示词”,你的朋友可能会很难画出你心中的东西
在计算机世界里,“”提示词”也是一样的。提示词帮助计算机(或者说是程序) 理解我们想让它做什么。例如,当我们和ChatGPT对话时,我们输入的话就是”提示词”,!告诉了ChatGPT我们心里想要的东西。你跟它说的任何话都叫提示词。也可以叫指令、命令、不要被名词搞量了,统统是指你对ChatGPT说的话~
所以,如果你的提示词越能准确的表达心里所想,GPT才会给出的效果更符合我们心里的预期。
不是ChatGPT不智能,是你的提示词说的不好,词不达意了~
对照官方介绍
ChatGPT的”prompt”(提示词) 是指用户提供给模型的输入或问题,以引导模型生成相应的回答或内容。在与ChatGPT进行对话或请求信息时,您提供的文本就是prompt,例如,如果您问ChatGPT:”明天天气怎么样?”那么这个问题就是prompt,模型将根据它来生成回答。Prompt通常是以自然语言的形式出现,它指示ChatGPT应该回应什么内容或采取什么行动。
7.大家总说的Embedding是什么?
大白话理解
openai给ChatGPT投喂训练数据”天气非常冷”,GPT在脑子里会将”非常冷”转换成数字”27.88”存储起来(27.88只是举个例子),GPT并不会真正的存储文字,而是存储Embedding(转化)后的数字,而数字记录了文字的特征。当你问它“天气非常凉怎么办”,GPT会将”非常凉”转换成”27.89”,发现和27.88”非常冷”距离非常近,识别出这俩是同义词。
虽然openai没有训练过“非常凉”给GPT,但是GPT通过Embeddings (转化)后的这两个词的距离很近,就知道你说的是”天气非常冷”啦,也就是ChatGPT智能的原因。
当你说了一些错误的词、句子,ChatGPT就能基本正确的理解到你的意思啦
Embedding就是这个转化的过程。Embedding是一种广泛的概念,它是把一种类型的对象(比如单词、人、商品等)表示为数字向量的一种方法。
对照官方介绍
Embedding5,中文可以叫嵌入,也可以叫向量化。嵌入是一段数据(例如,一些文本)的矢量表示,Embeddings也叫将文本、图像或其他数据转换为向量(vector) 的过程。这些向量通常具有较低的维度,但能够捕捉数据的语义和语境信息。向量化是将数据转换为数学向量的过程,使得计算机可以更好地理解和处理这些数据.
Embeddings的好处是,它可以将高维度的数据转换为低维度的向量,节省存储和计算资源,同时保留数据的关键特征。这使得机器学习和深度学习算法能够更高效地处理这些向量化数据,并进行模式识别和推理。
因此,Embeddings在自然语言处理、计算机视觉和其他数据处理任务中扮演着重要的角色,帮助计算机理解和处理现实世界中的复杂数据。在某些方面相似的数据块往往比不相关的数据具有更接近的嵌入。嵌入是浮点数的向量(列表)。两个向量之间的距离衡量它们的相关性。距离小表明相关性高,距离大表明相关性低。
8.Token又是什么?
大白话理解
在中文中,一个汉字是有含义的最小单位。在英文中,一个单词是有含义的最小单位。而在机器人的世界中,单词的一部分就有含义。比如,单词”tokenization”会被GPT分解为”token”和”ization”,其中的半个单词”ization”就是一个Token,半个单词”token”也是一个Token,Token就是GPT处理文本的最小单位,而不是一个单词或一个汉字奥。当然,有时候,一个单词就是一个token。
为什么这样设计呢?在计算机的设计中,”token”就像是乐高积木。有的”oken”很大,比如一个完整的单词;有的”token”很小,比如一个字母或者一个汉字。大的”token”可以帮助我们快速理解语言的大体意思,小的”token”可以帮助我们理解语言的细节。就像,大的积木块可以快速搭建大的结构,小的积木块可以用来做一些细节的装饰
假设一个外国宝宝和妈妈对话,宝宝最多能记住5000个单词,再说多了就忘了,则宝宝的对话的最大上下文长度就是5000个单词。同理,当GPT和你对话时,假设GPT的最大上下文长度是4000个token,根据粗略的经验,1个token大约相当于0.75个单词。则你俩对话最多是3000个单词,再多说,GPT就会忘记最开始你和他说了什么~这也是ChatGPT会失忆的原因。
9.什么是机器学习 (Machine Learning”)
大白话理解
想象一下,你正在教你的小狗做一个新的技巧,比如”坐下”。你会告诉它”坐下”,然后把它的屁股放在地上,接着给它一个奖励,比如一块狗饼干。经过多次重复,你的小狗开始明白,”坐下”这个命令意味着它需要把屁股放在地上,然后它就可以得到奖励。这就是它学会了新技巧的方式。
机器学习和这个过程类似。让我们把小狗换成一个计算机程席,把你换成一个程序员,把”坐下”这个技巧换成一个任务,比如识别一张图片上是否有猫。程序员会给计算机程序一些图片,并告诉它哪些图片上有猫,哪些没有。计算机程序会尝试找出图片中有猫和没有猫的区别
一开始,它可能会犯很多错误,但是通过反复学习和调整,最终,它会变得越来越好,能够准确地识别出图片上是否有猫。这就是机器学习的基本概念: 通过从数据中学习,计算机程序能够自己学会如何完成某个任务,就像小狗学会了“坐下”这个技巧一样。
这个例子简化了很多复杂的过程,但它能帮助我们理解机器学习概念。机器学习是一个大的领域
对照官方介绍
机器学习是一种人工智能 (AI)技术,它使计算机能够学习并对新数据做出预测或决策,而无需人为编程。简单地说,机器学习就是让机器从数据中学习。
机器学习的过程通常包括以下步骤: 首先,我们给机器提供大量的数据(也就是所谓的训练数据)。然后,机器会0使用特定的算法,如决策树、支持向量机、神经网络等,来学习这些数据的模式和规律。一旦模型被训练好,它就可以对新的、未见过的数据做出预测例如,我们可以使用机器学习来预测房价。我们首先提供一些房屋的信息(如面积、地理位置等)和它们的销售价格。然后,机器学习模型会学习这些信息与价格之间的关系。一旦模型被训练好,我们就可以输入一栋新房屋的信息,模型就能预测出它的价格。
机器学习被广泛应用于各种领域,包括医疗诊断、金融市场预测、自动驾驶、推荐系统等
10.什么是深度学习 (Deep Learning)
大白话理解
现在有一个小游戏,我们要将成千上万的卡通图片分类。每一张图片都是一个卡通角色,比如超人、蜘蛛侠、小猪佩奇等等。
机器学习的做法是,我们先找一些专家(比如动画师或者热爱卡通的大人),他们会告诉计算机:“超人通常穿着蓝色紧身衣,有个红色斗篷;蜘蛛侠有红蓝相间的装备和蜘蛛网图案,小猪佩奇是粉红色的,有个大圆头和一对小猪耳朵。“等等。然后计算机根据这些特征去分类图片.
深度学习的做法是,我们不再需要专家提前告诉计算机每个角色的特征是什么。相反,我们给计算机成千上万的已经标记好的图片(比如这些是超人,那些是蜘蛛侠,另外些是小猪佩奇),然后让计算机自己去学习和理解每个角色的特征。通过大量的学习,计算机最终能识别出新的图片里是哪个卡通角色。
深度学习用的是特别深、层次特别多的神经网络技术,所以可以自我学习特征,学习非常复杂的东西,它也属于机器学习的一种。对照官方介绍
深度学习是一种人工智能技术,它通过模拟人脑的工作方式来从大量数据中学习和识别模式。它是机器学习的一个子集,但不同之处在于深度学习可以自动学习数据的表示。
在深度学习中,我们使用称为神经网络的模型,这些模型由许多层组成,模拟了人脑的神经元如何处理和理解信息的方式。这些层被称为“深度”,所以得名”深度学习”。
深度学习在许多领域都有应用,包括语音识别、图像识别、自然语言处理(如ChatGPT所做的)、药物发现、游戏等。深度学习的一个关键优点是它可以处理非常复杂和大量的数据,并从中提取有用的信息和模式
暂无评论内容