AI分析《赛博朋克2077》玩家评价后：发现真爱粉都是来吸猫的

发布于：2020-12-16 10:19:39 栏目：技术文档

　　贾浩楠萧箫发自凹非寺

　　量子位报道公众号 QbitAI

　　CDPR 三度延期《赛博朋克 2077》，可把玩家憋坏了。

　　12 月 10 日上线当天，网上一夜间流行起各种赛博朋克的梗：

　　前期预售 800 万份，上线首日就收回成本，3 天时间就有 17 万留言评价…..

　　尽管 CDPR 不给游戏加密，默许盗版，但绝大部分玩家毫不介意为《2077》掏钱。

　　从来没有哪家厂商能像「波兰蠢驴」这样被玩家拥戴。

　　但是，《赛博朋克 2077》刚上线，按照 Steam 的评分规则，得到了「多半好评」。

　　好评率仅有 73%，今天也只达到 79%。

　　分数不低，但对于有《巫师》系列在前的 CDPR 来说，这个成绩还是有些意外。

　　谁在给《赛博朋克 2077》差评？大家在吐槽什么？

　　一位最硬核玩家 Kamil Czarnogórski，用 AI 分析了 Steam 上的评价，看看大家在讨论《赛博朋克 2077》的时候，都在说什么。

　　《赛博朋克 2077》，你还好吗？

　　Kamil 使用 Transformer，对抓取的 Steam 评论页有效信息进行向量化，并使用 UAMP 来对数据进行可视化，最后用k均值算法对关键词进行聚类分析，得出了下面的结果。

　　先看吐槽部分。《赛博朋克 2077》，对于玩家吐槽最多、给出差评最集中的两个点，一是配置要求高、二是游戏优化差、bug 多。

　　在配置方面，出现频率最高的词汇是游戏硬件配置相关，比如 RTX、1080P、DLSS 等等。

　　一波高配置玩家，秀了一把流畅运行的配置清单：

　　RTX2060、i7 8700、16GB 内存，感觉画面就像一部电影。

　　45-65 帧，RTX 2080、i9-9900K 与 32GB 的内存，光追效果全开，运行流畅。

　　2080ti 和 9700k 没有问题，可以开最高画质，帧率稳定 60 帧。

　　3080 FE 和 5800X，可以达到到 80-100 帧率，分辨率 1440p，其他设置都是最高。

　　可以看出，要想较为流畅地运行《赛博朋克 2077》，一块 2060 或更好的N卡是必须的。

　　目前，2060 国内电商售价在 2500-3000 左右，而 2060 只能算将将满足最高画质要求，要想玩的「从容」，还得更高配置。

　　加上 i7 8700 处理器，要开最高画质玩《赛博朋克 2077》，整套设备至少 8000-10000 元起步。

　　原来第一时间阻止我们玩《赛博朋克 2077》的不是工作\学业，而是钱。

　　有了真金白银，攒起了高配置电脑，但游戏的 bug 和崩溃情况还是令人头疼。

　　吐槽出现频率最多的词是崩溃（crashes），且玩家反映，崩溃情况多数出现在启动时、角色创建，以及镜头转场，比如过场动画和玩家视角的衔接。

　　其它小 bug 也频频出现。一位名叫 staigerd89 的玩家分享说，他的角色一直被一个特定 NPC 不明原因尾随：

　　崩溃和各种小 bug，是目前这款游戏被吐槽最多的情况。

　　此外，有大量玩家反映，主机平台优化太差，远不如 PC。

　　甚至有真爱粉先买了主机版，发现效果不好后，又花钱买了 PC 版。

　　在游戏性方面，玩家也提到打击和射击感比较生涩和迟滞，子弹打在物体上力量不突出，像是打海绵一样。

　　不可避免的，负面评价中另一个高频词是退款。

　　尽管被大量吐槽，但游戏本身精良的画面，和用心的制作细节还是让大家对它充满了期待。

　　给出差评的玩家，大部分认为目前的问题不影响整体质量，未来随着版本更新、bug 修复，优化会越来越好。

　　这一类评价中，出现最多的词是 wait、patch、better。

　　「波兰蠢驴」向来不在意盗版传播，也不给游戏加密，因为总有真爱粉支持正版。大家对 CDPR 的耐心和期待，也远超其它游戏厂商。

　　而且，游戏上线一天后，英伟达方面也立刻更新 460.79 版驱动，针对《赛博朋克 2077》做了全方位的支持和优化，几天下来，好评率从 73% 上升到 79%。

　　好评最多：撸猫

　　「配置要求高」、「前期 bug 多」、「感谢 Steam 给我退款」……《赛博朋克 2077》，你还好吗？

　　其实，仍然有多数玩家给出了好评。

　　好评中出现最多词汇，竟然是撸猫（petting the cats）。

　　大家纷纷表示，这是年度最佳撸猫游戏。

　　此外，玩家赞誉的点集中在画面效果好、游戏世界细节到位、夜城沉浸感强。

　　所以总的来说，《赛博朋克 2077》细节还不完善，前期 bug 较多，会出现崩溃。

　　但总体制作精良，未来更新令人期待。

　　3 步走，用 AI 解析 Steam 评论

　　那么，从「优化」、「退款」到「撸猫」，这些精准的关键词分析结果，Kamil 是怎么得出的呢？

　　数据处理

　　首先，获取上面这些（吐槽、撸猫等）评论的文本数据。

　　Steam 有一套游戏的配置工具包 Steamworks，其中一项功能是获取 Steam 游戏的评测，可以筛选时间、语言、正负面评价等，每次获取 20 条。

　　只需要写个 Python 脚本，就能迭代获取《赛博朋克 2077》的所有英文评论。

　　这些评论是一组组句子，接下来要将它们切分成 token（字，包括单词和标点符号），用 NLP 的 Python 工具包 NLTK，通过 sent_tokenlize 对所有句子进行字词分割。

　　在那之后，再对输入进行向量化（embedding），这里用到的框架是 Sentence Transformers（BERT 和 XLNet 结合的多语言句子向量框架）。

　　分析数据的目的，是为了寻找句子的语义相似度，因此采用了框架中的预训练模型 roberta-large-nli-stsb-mean-tokens。

　　这里的语义相似度，就是将相似的句子聚集在一起的关键，例如这些吸猫评论：

　　用这种模型对数据进行处理后，就能将输入的评论转换为高维向量（便于聚类分析）。

　　数据可视化

　　接下来，是将这些向量可视化，更好地看清评论的分布。

　　但经过 Transformer 获得的高维向量，还不能直接可视化。

　　因此，需要将这些 1024 维向量（转换出来的高维向量，是将语义编码成 1024 个数字的序列），先降维成二维向量。

　　这里会用到一种名为 UMAP （统一流形逼近和投影）的技术，能将高维向量转变成二维向量。

　　在二维向量的可视化图中，彼此接近的点表示具有相似含义的句子，如果发生簇分离，则代表评价的内容并不相同。

　　如下图，经过处理后的可视化评论中，绿色代表正面评价，红色代表负面评价，颜色越深，表示负面评价的占比越大。（例如上面那些有关退款的评价，就可以组成一个退款群了）

　　而在离集群很远的左上角，有一小撮人在“自说自话”，这群人给出的 140 条评价，全都是好评。

　　没错，这就是刚刚那群沉迷吸猫的玩家……（毕竟，连水下也能吸猫）

　　当然，快乐吸猫只是游戏中的一个细节。

　　为了更全面地搜集有关游戏的整体评价，还需要对这些数据进行聚类分析。

　　聚类分析

　　聚类分析，是对评价进行整体分类的方法，也就是对这些处理后的二维向量进行分组。

　　例如被分到「游戏会更好」的评价组里，就会看到大量的 wait、patch、better，这些词共同组成了这个评价。

　　这里的聚类分析，采用的是k均值算法（k-means）。

　　k 均值算法唯一需要的参数是簇数（将这些二维向量分成多少组），这里盲猜 75。

　　簇数越大，分类就越细，反之则越普遍。运用k均值算法后的 75 个分类如下：

　　其中，每一簇都会有一个质心（centroid），是一句最能代表集群的“虚构”的话。

　　为了做出像上面评价那样的可视化关键词，会在簇中选取与质心最接近的句子，并分析句子作者的游玩时间：

　　在那之后，会将分析后的字词进行可视化：

　　至此，就完成了对《赛博朋克 2077》Steam 上评论的分析。

　　这次筛选出来的的评论，主要是作者精选的 15 类评论，包括 5 个讨论最多的话题、5 个评价最高的话题和 5 个评价最低的话题。

　　如果你还有更好的分类方法的话，可以自己上手操作起来了~

　　作者介绍

　　Kamil Czarnogórski，毕业于格但斯克大学（University of Gdańsk）计算机科学系，这是一个位于波兰的大学。

　　《赛博朋克 2077》的开发商 CDPR 也来自波兰。

　　Kamil Czarnogórski 表示，这次做的评论分析，只针对发行后的 24 小时内的游戏评价。

　　在他进行分析的这段时间里，Steam 上对于《2077》的评价已经上涨到了 80%，截至 12 月 14 日，有关《2077》的评价已经达到了 81%。

　　当然，游戏具体如何，还得亲自一试。

　　目前这位小哥已经上手了这款游戏，打算给出自己的见解。

　　你已经玩了《赛博朋克 2077》吗？

　　「波兰蠢驴」的新作品满足你的期待吗？

　　欢迎留言告诉我们~

相关推荐

合肥KTV招聘模特佳丽日结包住宿经验者享受优先待遇
上海KTV招聘酒水促销员全职兼职都可以少
合肥KTV招聘酒水促销员包住宿报路费
小米集团2024年三季度创造了单季史上最强业绩
苹果开发采用博通台积电N3P工艺制造的AI芯片

阅读 + 点赞 +