被爱……?

https://mp.weixin.qq.com/s/2k4-gdwRcpj6vgON6Yrc1w?scene=262&from=industrynews#rd

判她被爱却判我悲哀——来自《蔚蓝档案》的经验证据

得不到的就更加爱

越音就越爱 越急就越败

罪证都收集起来

判她被爱 判我悲哀

——大水母绚烂

引言

为什么有的角色得到了更多的爱与关注,而有的角色得到的相对较少?个人特质,尤其是外貌,如何系统性地影响角色的“被爱”程度?本文利用游戏《蔚蓝档案》(Blue Archive)的相关数据,本文尝试为解释该问题提供一系列的经验证据。

借鉴Galgame的常见范式,本文将角色的“被爱”操作化为四个可量化的维度:剧情文本量、皮肤数量、权力地位、以及皮肤推出速度。本研究利用预训练动漫图像识别模型(Waifu Diffusion Tagger)提取了游戏中大量角色的客观外貌特征(如发型、发色、服装、配饰等),形成一个原创数据集,并在此基础上建立了计量经济模型,系统性地检验了“颜值即正义”这一系列假说在虚拟世界基沃托斯是否成立。

初步研究发现,角色的外貌属性确实与其资源分配存在显著关联:例如,拥有发髻的角色往往被赋予更高的权力位置和更多的皮肤;而巨乳、深色头发的特征则显著缩短了新皮肤的推出时间。本研究不仅为理解二次元文化中的角色人气机制提供了新的数据视角,同时锻炼了笔者本人的技术能力。

图片

综述

在讨论什么因素影响角色的“被爱”程度之前,首先要对“被爱”这一概念进行简要界定。来自笔者游玩过的galgame的经验证据表明,“被爱”这一概念主要体现在:

(1)文本数量。来自雪碧社《苍之彼方的四重奏》的证据表明,鸢泽美咲和有坂真白的“被爱”程度更高,因为她们均获得了EXTRA的机会,特别是美咲的EXTRA2文本量更大,剧情更加精彩。因此,本文将“被爱”操作化为文本数量。

图片
角色:鸢泽美咲

(2)立绘数量。来自SAGA《金辉恋曲四重奏》的证据表明,真女主僧间理亚的“被爱”程度更高,因为理亚在《金辉恋曲四重奏》以及《金辉恋曲四重奏Golden~Time》中有最多的立绘数量(僧间理亚+玛利亚)。因此,本文将“被爱”操作化为立绘数量。

图片
角色:僧间理亚

(3)权力位置。来自柚子社《魔女的夜宴》《千恋万花》和《Riddle Joker》的证据表明,1号位女主绫地宁宁、朝武芳乃和三司平野绫都具有更高的权力位置(超自然研部长、神社的巫女、学生会长)。因此,本文将“被爱”操作化为权力位置。

图片
角色:朝武芳乃

(4)续作距离时间。来自Key社《Summer Pockets》和《Summer Pockets REFLECTION BLUE》的证据表明,有续作或改进版的作品或许可以被视作得到了更多爱。Key社出品的其他精品如《Little Busters!》《CLANNAD》《AIR》等都没有得到加强版或续作的机会。因此,本文将“被爱”操作化为续作距离时间。

图片
角色:鸣濑白羽

什么因素影响了角色的“被爱”。本文认为,作为美少女游戏,角色的外貌属性构成了影响“被爱”的主要因素。海豹社《甜蜜女友》系列的独特画风描摹了众多颜值出众的美少女并备受关注,紫社凭借画师克的独特笔触,出品了《天津罪》《青鸟》等备受好评和关注的作品。

图片
角色:水无月萤

因此回到《蔚蓝档案》中来,本文将系统性考察角色外貌属性与角色“被爱”程度的相关关系。结合《蔚蓝档案》中角色的实际情况,本文提出如下4个探索性假设。

H1:角色的外貌属性会影响角色的对话条数。

H2:角色的外貌属性会影响角色的皮肤数量。

H3:角色的外貌属性会影响角色的权力位置。

H4:角色的外貌属性会影响角色皮肤推出的时间。

数据来源

本研究的数据来源于 Kivo Wiki (https://api.kivo.wiki),该平台为《碧蓝档案》提供完整的角色信息数据库。通过RESTful API 接口,对游戏中的学生角色数据进行了系统性采集。

数据采集范围:本研究采集了 ID 范围为 1-550 的所有学生角色数据,涵盖了游戏内主要角色及其衍生皮肤版本。采集过程中设置了 0.5 秒的请求间隔以避免对服务器造成过载。

采集的数据包含以下维度:基础信息:角色ID、全名、昵称、皮肤名称、所属学院、社团归属;角色属性:年龄、生日、身高、武器类型;制作信息:角色设计师、插画师、日文配音演员、中文配音演员;文本数据:角色简介、爱好描述、配音对话内容;多媒体数据:角色立绘图片(PNG格式)。

最终,287个角色(最新推出的荒槙八云和三善贵音尚未收集)的相关信息及其头像成功爬取。

图片
图片

变量设计

因变量:

(1)对话条数(text)。

针对对话数据的统计,本研究采用以下处理原则:优先提取国服中文对话数据(voice_cn 字段),若不存在则采用日服对话的中文翻译(voice.text_cn 字段)。并进行去重处理:排除带有 _GL 后缀的国际服重复版本,仅统计日服原版配音条目。

最终数据集包含257条有效角色记录,对话条数的分布可视化、top10和bottom10如图所示。其均值为72条,中位数为76条,分布为纺锤形。最多的角色是雅迪电动车(野正莱依),最少的角色是泳装艾米(和泉元艾米:泳装)。

图片
图片:对话条数

(2)皮肤数量(skin)

皮肤数量仅需在全样本中统计姓名出现的次数即可。值得注意的是,本文将已实装角色的未实装皮肤统计在内(如爱清枫香:便服),但并未将原皮都没实装的角色统计在内(如绘里香、FOX小队)。

最终数据集包含130个独特角色记录,皮肤数量可视化结果表明,绝大部分角色只有2个皮肤(默认皮肤和1个换装),仅有2个角色(小鸟游星野和砂狼白子)有4个皮肤,这里将白子*Terror视作白子的皮肤。

图片
图片:皮肤数量

(3)权力位置(power)

如何衡量一个角色的权力位置?本文仅参考学生在学院和社团中担任的职务进行简单处理。首先,将学院的领导者赋值为2(如圣园未花、百合园圣娅、调月莉音、龙华妃咲等。这里,本文将羽沼真琴和丹花伊吹共同视作歌赫娜学院的领导者),并将社团的领导者赋值为1(如爱清枫香、空崎日奈、美甘尼禄),其余角色赋值为0。其次,出于学院间异质性的考虑,更精确的方法是利用其统治人数进行加权,如统治23名独立的歌赫娜学生的伊吹赋值为23,而统治7名独立的山海经学生的妃咲仅赋值为7。

最终数据集包含130个独特角色记录,权力位置分布可视化和top10如图所示。其分布为沙漏型,绝大部分角色仅是草民,权力位置最高的是则茶话会三人组。

图片
图片:权力位置

(4)皮肤推出时间(time)

最后一个变量为皮肤推出时间。在排除一直没有新皮肤的角色(如枣伊吕波TvT等)后,计算每个角色自默认皮肤登场以来距离其第一个换装皮肤的天数。

最终数据集包含91个独特角色记录,皮肤推出时间可视化,bottom10(最快推出)和top10(最慢推出)如图所示。其分布为纺锤形,均值为733天,中位数为686天。最快推出新皮肤的角色是白洲梓,日服2021年5月27日登场,泳装皮肤2021年6月30日实装。最慢推出皮肤的角色是闪光弹(守月铃美)相隔了1721天(TvT),自日服开服第一天(2021年2月4日)到2025年10月22日魔法少女皮肤实装。

图片
图片:皮肤推出时间

自变量:

在角色外观特征的构建上,本文并未直接依赖人工标注,而是基于预训练的动漫图像多标签标注模型对大规模角色图像进行自动标注,并在此基础上进行特征抽象与规约。具体而言,我们使用了 Waifu Diffusion 1.4 Tagger 。Waifu Diffusion 1.4 Tagger 是一类针对二次元/动漫风格图像优化的多标签分类模型,其训练数据主要来源于 Danbooru 等大型动漫插画数据集,可以在单张输入图像上同时预测数百个可能的语义标签(如角色发型、发色、服装风格、配饰、表情等),并为每个标签给出一个 [0,1] 区间内的置信度分数。该工具既提供可视化网页界面,便于交互式观察单张图像的标签结果,也提供面向程序的 HTTP API 接口,支持批量图像的自动化标注。

在具体实现上,本文通过脚本调用 Waifu Diffusion 1.4 Tagger 提供的 API 接口,对全部角色立绘图像进行批量推理。对于每一张图像,脚本首先将图像预处理为模型所要求的输入尺寸与格式,随后通过 HTTP POST 请求将图像内容(以文件或 base64 编码形式)发送至标注服务端点。服务端基于预训练的SmilingWolf/wd-swinv2-tagger-v3模型对图像进行前向推理,返回一段 JSON 格式的结构化结果,其中包含若干形如 { “label”: <标签名>, “confidence”: <置信度> } 的条目。我们将这些返回结果解析为“标签→置信度”的字典形式,并将之存入表格数据中,作为后续特征工程的原始输入。为降低噪声标签的干扰,在数据清洗阶段,对于置信度极低的标签(General Tags Threshold=0.35,Character Tags Threshold=0.85)我们选择直接忽略,仅保留模型具有一定置信度的预测结果。

由于原始标签空间高度细粒度且不同图像出现的标签集合并不完全一致(例如对于发型,有的图像可能被标注为"long hair",有的则为"twintails"或 “ponytail”,还有部分图像则缺乏明确发长标签),若直接将这些底层标签用于建模,将导致特征维度过高且样本间不可比。因此,本文在标签预测结果之上定义了一层统一的、高层次外貌特征,并将其规约为若干个 0/1 二元变量,使得不同角色间能够在同一特征空间内进行比较。最终,我们围绕发型、发色、配饰、服装风格与表情等方面,构建了如下外貌特征变量:

表格:变量定义

图片

上述二元变量的构造依赖于一组事先设定的标签–特征映射规则。以发型为例,若某一图像的预测标签中包含long hair,或出现ponytail, twintails等通常与长发强相关的标签,且未同时出现如 short hair、bob cut 等典型短发标签,则将该图像的 hair_long 赋值为1,否则赋值为0。其余变量类似。通过上述自动标注与规则化映射流程,本文在尽量保留预训练模型丰富视觉语义的同时,将原本稀疏且不一致的标签输出规约为一组在所有角色之间具有可比性的外貌特征向量。这不仅显著降低了特征空间的维度与噪声,也为后续的统计分析与实证建模提供了一套结构清晰、语义明确的外观表征。

自变量的描述性统计如下表所示。本文发现,长发 (hair_long) 是主导风格(如天童爱丽丝),超过 3/4 的角色。这符合动漫角色设计偏好(长发更易于多样化造型),深色头发/眼睛 (hair_dark, eyes_dark) 占一半左右,表明暗色调是主流审美。更大胸部 (chest_volume) 和泳装暴露 (swimsuit_exposure) 各占40%和28%(如夜樱绮罗罗、下江小春:泳装)。而眼镜 (has_glasses) 只在 6.61% 角色中出现(如奥空绫音),可能是因为眼镜常用于特定个性,发髻 (hair_bun) 和日式服装 (japanese_clothes) 也较少。同时,本文提供了按学院分组的比例(%)的描述性统计。

表格:总体描述性统计

图片

表格:分学院描述性统计

图片

为简单证明本文识别的准确性,本文选取角色飞鸟马时和爱清枫香(新年)进行人工验证。具体数据如下。按照识别的结果,小时应当是短发、无双马尾、无单马尾、有编发发型、有发髻、小胸部、非校服、非日本服饰、低暴露度、浅色发色、浅色眼睛颜色、无眼镜、兽耳、角、帽子和首饰的角色。而爱清枫香(新年)应当是长发、双马尾、非单马尾、无编发发型、无发髻、小胸部、非校服、非日本服饰、低暴露度、深色发色、深色眼睛颜色、无眼镜、兽耳、帽子、首饰、有角的角色。飞鸟马时的识别基本正确,而爱清枫香除了日式风格服饰识别有误外基本正确。

表格:飞鸟马时与爱清枫香(新年)的描述性统计

图片

图片
图片:飞鸟马时(左)与爱清枫香(新年)(右)

实证检验

本文简单使用控制学院固定效应的OLS模型进行检验。其中,自变量除上述角色外貌特征的定类变量外,本文还加入了角色年龄(Age,其中春原瞬因为淑女的年龄缺失被剔除样本)、身高(Height)和登场时间(time1,以月为单位,2021年2月为基准),并先后控制学院固定效应。

针对H1:角色的外貌属性会影响角色剧情中的对话条数。本文选取全部实装角色(包含皮肤角色)进行回归分析。结果表明,不论是否控制学院固定效应,登场越晚的学生对话条数越多,这符合我们的一般认知。而戴眼镜的角色对话条数显著偏少,可能的原因在于眼镜娘角色人气相对较低(奥空绫音、火宫千夏、风仓萌绘等),因而剧本家并未投入更多精力去设计。

图片
图片
图片:对话条数的回归分析

针对H2:角色的外貌属性会影响角色的皮肤数量。本文选取全部默认皮肤角色进行回归分析。在未控制学院固定效应的情况下,登场越晚的角色皮肤数量越少,符合一般认知。同时,穿着校服的角色皮肤数量显著较少(霞泽美游、樱井美代等),可能的原因在于校服风格着装的角色更加老实本分,从而难以对其设计活动从而推出新皮肤。而在控制学院固定效应后,有发髻的美少女的皮肤数量显著更多。

图片
图片
图片:皮肤数量的回归分析

针对H3:角色的外貌属性会影响角色的权力位置。本文选取全部默认皮肤角色进行回归分析。在未控制学院固定效应的情况下,登场越晚,年龄越大,身高越矮,有发髻并且未身着日本风格服饰的学生的权力位置越高。在控制学院固定效应后,仅登场时间、年龄和发髻显著。端庄的发髻设计以及更加年长的年龄,或许是为体现领袖权威的设计。

图片
图片

针对H4:角色的外貌属性会影响角色皮肤推出的时间。本文选取全部默认皮肤角色进行回归分析。在未控制学院固定效应的情况下,巨乳且深色头发的学生推出新皮肤的时间更短,可能的原因在于这种类型的学生皮肤的设计空间更广阔。在控制学院固定效应后,仅胸部大小对推出新皮肤的时间呈现显著的负相关。

图片
图片

结语

本研究基于《蔚蓝档案》的实证数据,初步探讨了角色外貌属性与其“被爱”程度之间的关联。结果表明,特定的外貌特征,如发髻、胸部大小、发色以及是否佩戴眼镜等,确实在不同维度上对角色的资源分配和玩家关注度产生了显著影响。这为理解二次元作品中角色人气差异提供了一个基于数据的外观视角。

然而,角色的“被爱”是一个复杂现象,外貌仅是其中一环。角色的性格塑造、剧情表现、声优演绎、强度设计等内在特质,同样扮演着至关重要的角色。本研究存在极大的局限性,例如“被爱”的度量方式可以更加多元,外貌特征的自动识别也存在优化空间。未来的研究可以纳入更多维度的变量,从而更全面、深入地揭示角色赢得喜爱的奥秘。

图片

Last edited by @dfeath777 2026-01-03T03:46:44Z

7 Likes

你牛大了

3 Likes

蔚蓝档案是不是有部番来着,,,我好像看了一集就弃了

1 Like

不知道,但是恋童癖真恶心

5 Likes

好家伙,这论文写法太学术了,数据可视化看着还挺专业(笑)

2 Likes

找不是男同的同学乱搞的男同也是真恶心。你说对吧
@kongting

3 Likes

我不是男同:enraged_face:

2 Likes

大哥我说你是男同了吗?不要对号入座

5 Likes

好的好的,那我可以草拟了吗:face_savoring_food:

3 Likes

?大哥别草我。

3 Likes

我超,盒

4 Likes

其实估计没几个不知道我皮下的

3 Likes

没那么多

1 Like

我不知道。

1 Like

没事,我早就知道你皮下了。两清,嗯。

3 Likes

我草啊,我应该注册一个新号

4 Likes

早晚会被认识的开出来

1 Like

我或许说的太多了,SubQuiz 社团什么的,都很容易开出我

4 Likes

是这样的。我主要是认识的人太多了。

1 Like