“就是不知道这个模型的水平怎么样了。”
陈腾没有细看系统给的u盘。
不用看都知道,他肯定看不懂的。
第四个,大数据统计分析技术。
这项技术是腾达目前具备,但同时还是需要的。
因为ai的学习与成长,需要依赖的就是庞大的数据库。
没有庞大的数据库,ai什么都不是。
再怎么精妙的模型和,都需要庞大的数据库。
而这个庞大的数据库,又必须精挑细选数据源。
优秀的数据可以帮助ai更加快速地成长,达成想要的目标。
反之,垃圾的数据库很有可能会导致ai倒退。
拿围棋界的阿尔法狗举例。
就算是一开始阿尔法狗什么都不会的时候,背后的团队也绝对不可能给它喂两个臭棋篓子下出来的对局。
喂的数据,一定是经过精挑细选的高水平对局。
到了阿尔法狗天下无敌的时候,人类的棋局也不会再往它的数据库里喂了。
为什么?
因为这个时候,哪怕是人类顶尖高手的对局喂进去,那都属于污染数据库了。
那么新的问题来了,如何精挑细选优秀的数据喂进去呢?
围棋这种还好,可以通过人工的方式把数据喂进去。
那更加复杂的模型呢?
两个方法。
第一个,继续加人。
核心成员不够,那就外包团队。
每个人在输入图形验证码的时候,都相当于是他们人工智能的外包团队,帮他们喂数据。
第二个,让其他经过简单训练的ai帮忙筛选一遍数据,将一些污染能力比较强的数据给筛出去。
这就需要用到大数据统计分析技术了。
这个技术非常地笼统,应用也非常地广泛。
短视频平台给用户的喜好打标签,分析用户喜欢的视频类型,就是这项技术的应用。
将数据喂给gpt这样的人工智能之前,也要经过预先的数据分析。
但就这两样的数据分析,完全又是两个方向的数据分析。
虽然名字一模一样,实际的内容和具体的技术又南辕北辙。
陈腾打开系统给的大数据统计分析技术。
在技术原理之前,系统还贴心地附上了介绍说明。
“总算是有能看懂的了。”
陈腾详细地看了一遍这个介绍说明,发现系统给自己的这项技术非常全面。
文字、语音、图像、视频……以及其他各种各样复杂的数据处理技术都有。
“这个技术好啊。”
陈腾赞叹。
人工智能从训练到使用一共三步。
数据选择——数据处理——人工智能学习训练。
有了系统给的这项技术,不管是想要训练什么类型的人工智能,在第二步上都会省下很多很多的时间。
“看来他们有的学了。”
陈腾又往下拉了拉剩余的内容。
剩余的内容足足有数千页,且都是比较复杂的内容和理论。
这些东西想要研究明白,就不是短时间内可以做到了。
不过要是学明白了,腾达的人工智能也会向前一大步。
陈腾看完这项技术,目光落在了第五个奖励上。
【第一代fnct架构方案】。