笔者自2018年起经手两厅院售票系统之数据分析。在这些年间,台湾表演艺术产业整体,不论是从机构组织、场馆或是团队方,对相关数据的重视有明显的成长。文策院更是建构产业研究资料库,从整体文化面进行分析。以上量化观念的引入,无疑是台湾表演艺术迈向产业健全化的过程中,重要的一步。
然而,目前的资料与数据分析,距离完善显然还有相当的距离。本章中,就请容笔者从个人观点,依据个人这些年从事数据分析之角度,诉说可能的未尽之业。
资料处理与可比较性
表演艺术产业由于节目的异质性,使得可比较性成为分析上相对艰巨的难点之一。目前虽尽量以系统上之节目类别乃至于子类别进行分类,但这仍然是一个非常粗略的分类比较方式。就算都是「音乐类」的「动漫音乐会」,「宫崎骏动画配乐」跟「日本动漫音乐会」,其所对应的演出曲目类别以及观众群,就已经有显著的不同。在这个状况下,任何跨类别或跨年度的比较,在某种程度上,都将一些本质上有明显差异的节目,视为类似的节目进行比较。
以上尚不讨论,就算是完全相同的演出曲目或剧目,由不同的演出团队演出,很可能差异会大到可视为完全不同性质的节目。以上也尚不讨论,现在许多长销剧的卡司会随日期不同而不同,此也会导致相同的节目在不同场次有显著不同。
追根究柢,表演艺术的「产品」是高度特质化的,每一个节目都是独一无二。虽说在「大」样本下,我们或许可以「期望」这些差异会被平均化,但要摊平如此多可能造成差异的因素,说实在话,我们的样本其实没有那么「大」。
团队曾经试图使用如ChatGPT或llama等大型语言模型(LLM),试图进一步去定位各节目之间的异质性。但就目前的结果看来,LLM对台湾表演艺术生态的理解仍有限。(注1)看来LLM对表演艺术的参与程度仍待培养。
跨平台整合之我们需要更多资料
OPENTIX虽为目前台湾最大的表演艺术售票平台,有相对大量的资料,但若我们真要建立足够的量化基础作为产业的后盾,我们其实还需要很多、很多的资料。
首先,OPENTIX毕竟只是台湾整体表演艺术的局部。要反映台湾产业的整体发展,其他售票平台的数据也是不可或缺的。这不能只是一个「总销售量」这样的年度数据而已。如诸位所见,数据分析中有许多的分析,都建立在节目的细部资料,乃至于消费者的细部资料上。仅仅只是把各售票系统的叙述统计量加在一起,是远远不够的。
其次,我们可能也会需要很多「其他」资料库的辅助。必须意识到的是,台湾表演艺术的消费人口,占台湾总人口的少数。透过各售票系统的资料,我们顶多也只能看到已经参与表演艺术的少数族群。若我们要做观众开发,乃至于要将表演艺术推向大众,我们就势必需要能观测到尚未在系统中,尚未购票的多数族群。
否则,我们会连「免费演出是否能够带动观众后续观赏购票演出」这样的问题都无法回答。