我们分析了知乎关注量前20的专栏,大V的铁杆粉本来是这样一群人
前几天,我们抓取了知乎关注量前 20 的专栏,以及关注它们的用户的信息。这 20 个专栏关注用户数如下:
截止至 8 月底,,进入知乎专栏TOP20 的门槛约为 9 万 7 千人(谢熊猫出没注意)。排名前 20 的知乎专栏,大概可以分为以下派系:
1.知乎官方队。或者和知乎联系紧密的专栏。例如:官方的 “知乎电子书”、扒知乎热门内容的 “知识青年”。
2. 两性提升类。着重于女生美妆、穿衣搭配的“女神进化论”、“美便是正义”;以及关注健身的“硬派健身”和“健身自习室”。其中,“女神进化论” 的关注人数已经超过知乎官方的知乎电子书,位列所有专栏的第 1 位。而侧重男性健身的 “硬派健身” 也仅次于“女神进化论” 和 “知乎电子书”, 位列第 3 位。男生女生们对自身吸引力的提升的关注可见一斑(果然性吸引力是第一生产力)。
3. 兴趣喜好类。例如: 关注美食的 “下厨房” 和 “你不成能做欠好一锅红烧肉”, 关注住宿的 “好好住指南”, 关注旅行的 “一群旅行体验师”, 关于电影的 “知影”, 关于心理学的 “幸福课” 和 “潜台词”。
4. 故事类。例如:“故事贩卖机”、“异教徒告解室”等。
5. 独立作者类。主要由是知乎大V开创的个人专栏,内容未限定,主要靠大V个人魅力获得广泛关注。例如:张佳玮的 “张佳玮写字的地方”、谢熊猫君的 “谢熊猫出没注意”、以及葛巾的 “女院的教室”。
6. 技能类。主要是路人甲的 “学习编程” 和你现在所处的 “数据冰山”。 数据冰山目前关注人数在 15 万出头,位列第 9 位。
用户基本兴趣取向
这 20 个专栏的男性比例如下:
20 个专栏中,大多数都是男性占优势。其中,“学习编程” 以85%的男性占比排到了第 1 位,这跟该专栏的主题有莫大关系。而关注数据分析在商业领域应用的 “数据冰山” 也以将近80%的男性比例排到第 2 位。唯二的男性比例不过半的专栏为:“女神进化论” 和 “美便是正义” —— 这里是爱美妹子的主场。
为了了解用户的基本兴趣取向,我们选择从用户填写的专业入手,从专业洞察用户的兴趣特征。为简化问题,我们将用户填写的专业重新归类为:文科、理科、社科、法学、商学、艺术、工程、医学等几个大类。再根据这几个大类的特点,为其在 “文科 vs. 理科” 和 “基础学科 vs. 实践学科” 两个维度上进行重新编码。编码对应表如下:
由此得出这 20 个专栏在两个维度上的分数:
以 “学习编程”为代表的实践理科型 和 “女神进化论” 为代表的基础文科型构成了知乎专栏TOP20 的用户的两极。其中,“学习编程” 以超高的理科占比和实践类学科占比成为离群点,这和其比例超高的工科学生占比有关。内容相似的专栏也在专业维度上呈现出临近的特点:例如同样关注女生美妆和搭配的 “女神进化论” 和 “美便是正义” 距离很近;同为作者个人专栏的 “张佳玮写字的地方” 和 “谢熊猫出没注意” 靠的很近;“知乎电子书” 和 “知识青年” 比较接近。当然也有一些不测的情况:关注数据分析的 “数据冰山” 和关注健身的 “健身自习室”的关注用户在专业维度上竟然相差不久不多。
男性占比和“文vs理” 的相关系数为0.84, 男性占比和“基础vs实践” 的相关系数为0.76, 专业维度的两个维度的相关系数达到0.91。三者均为高度相关,反映了这三个指标下衡量的内容的一致性。若将三者化而为一,则生成了知乎专栏用户兴趣取向的基本维度。简单地将三个指标归一化之后平均,得到:
在基本兴趣取向的维度上,这一边,是主打基础文科女的 “女神进化论” 和 “美便是正义”;那一边,是主打实践理工男的 “学习编程”。其余专栏在基本兴趣维度上则处在二者中间的位置,程度纷歧。数据冰山则在实践理工男的维度上仅次于学习编程,以对实践类理工科有兴趣的男生为主。
从用户看发展前景
用户行为的数据指标多而杂,为简单起见,将指标划分为以下三类:
1.内容生产:答题数、发布文章数、发起的知乎live数;
2. 内容关注:关注人数、关注问题数、关注专栏数、参加的live数和关注的话题数;
3. 个人成就:获得的赞同数、被感谢数、被保藏数和被关注的用户数。
将其赋予差别的权重,来得到内容生产量、内容关注量和个人成就三个指标。这 20 个专栏用户的平均内容生产量和平均内容关注量如下:
内容生产量和内容关注量是正相关关系。
这些专栏用户的平均内容生产量和成就如下: