Modern Marketing 现代市场营销, 2020, 10(2), 44-51
Published Online May 2020 in Hans. /journal/mom
/10.12677/mom.2020.102007
Analysis of Consumers’ Evaluation of
Domestic Cosmetics Brand Based on
Python Text Mining
Lin Lin, Jie Gu, Yang Jiao, Huqin Yan
Xiamen National Accounting Institute, Xiamen Fujian
Received: Apr. 1st, 2020; accepted: Apr. 15th, 2020; published: Apr. 22nd, 2020
Abstract
By using the big data mining method of Python beautifulsoup, word frequency analysis method of Python Wordcloud, and the Chinese character analysis method of Python Jieba, this paper analyz-es the existing problems of domestic cosmetics brands and the most important consumption hot spots for consumers based on the feedback from consumers in various platforms. We select three domestic cosmetics brands with different positioning—Judydoll, Perfect Diary and MAOGEPING as reference. We use a large number of comments for text mining, word frequency statistics, analysis of consumption hot spots, and then analyze the characteristics of each brand, target population and suggestions for further development. Finally, according to word frequency calculation of the proportion of different consumption hot spots, we find out the most important direction of con-sumers. The research results can be used as a reference to improve the use experience of domestic cosmetics brands and further develop local brands.
Keywords
Text Mining, Domestic Make-Up, Focus of Consumption
基于Python文本挖掘的消费者对国产彩妆品牌评价的分析
林琳,顾洁,焦阳,阎虎勤
厦门国家会计学院,福建厦门
收稿日期:2020年4月1日;录用日期:2020年4月15日;发布日期:2020年4月22日
林琳 等
ckeditor怎么上传图片
通过应用Python Beautifulsoup 大数据挖掘方法、Python Wordcloud 词频分析方法、以及Python Jieba 汉字词库分析方法,本文根据各大平台中消费者的反馈,分析了国产彩妆品牌存在的问题及消费者最看重的消费热点。通过选取定位不同的3个国产彩妆品牌包括橘朵、完美日记、MAOGEPING 作为参考。利用大量的评论进行文本挖掘、统计词频、分析消费热点,进而分析每个品牌的特点、目标人及能够进一步发展的建议。最后,根据词频计算不同消费热点所占的比重,以出消费者最看重的方向。研究结果可作为参考,以此改进国产彩妆品牌的使用体验,进一步发展本地品牌。
京东python入门教程关键词
文本挖掘,国产彩妆,消费热点
html标签大全下载Copyright © 2020 by author(s) and Hans Publishers Inc.
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0). /licenses/by/4.0/
1. 引言
近几年,中国美妆市场增长势头强劲,中国成为全球第二大化妆品消费国。一些小众新锐品牌频频爆红,各种之前被嫌弃的国产化妆品频繁出现在各大“种草”平台,更存在国产品牌谈论度甚至力压国际知名品牌的态势。高颜值、高性价比、快速迭代的“国潮”文化持续推动着国产彩妆不断升级,短视频和在线直播等社交工具可视化技术和交互共享需求持续推动着中国彩妆品的热销。这些“新国产美妆”品牌诞生于线上,成立时间或走红时间均不足三年,但天猫旗舰店的单品月销量都达到几万以上的级别,国货美妆热度空前。尽管如此,国内市场对新近崛起的美妆品牌的质疑声依旧不断,从抄袭嫌疑,到纯贴牌模式、没有技术,初期“平价替代”模式已经难以满足品牌长远发展的需求,在竞争不断加剧的市场中,国产品牌的研发能力和品牌影响力上仍与国际大牌存在巨大差距。在各种媒体与社交软件中,消费者对各个国产品牌的产品质量仍存在褒贬不一的声音。消费者对国货彩妆的态度到底怎么样,消费者的评判标准和关注热点是什么,哪些因素可能对营销品牌的口碑产生影响,这些问题在市场分析中都是必须回答的。
以往,由于受分析工具的限制,商家对于消费者市场消费行为的分析并不容易。一是收集数据难,对于网络上散见于不同网页和论坛上的消费意见寻、查看、分析都很不容易。二是数据统计分析难,面对海量的数据信息,难以抓住要领。三是信息识别难,特别是彩妆品牌商品,中文外文夹杂在一起,处理起来颇费周折。开源计算机语言Python 语言正好提供了解决这三个问题的工具方法。其中,Beautifulsoup 方法,主要用于网页数据爬虫,它可以帮助我们将不同网页上的信息转化为文本信息,
并且通过文本挖掘来处理。Wordcloud 词云方法,专门处理文本词汇,它可以将文本中不同的词汇按照出现的频率进行排列和统计,那些出现频次较高的词汇一般表现了消费者所关注的焦点问题。Jieba 汉字库方法专门用于汉字词汇处理,由于汉字的字符之间没有空格将其分隔开来,所以在词频分析时需要专门识别汉字词库的方法。所以,将Python 的Beautifulsoup + Wordcloud + Jieba 方法应用于市场分析,可以很好地帮助我们来理解和分析消费者的消费行为。
林琳等
计算机软考高级职称本文选取了几个具有代表性的国产彩妆品牌的网络评论进行文本处理。先提取高频词,分析消费者的关注热点,对几个品牌横向比较的同时,在内部纵向比较消费者对哪个消费属性比较敏感,从而得以在大数据的支持下探讨消费者对国货彩妆品牌的总体态度。excel表格常用的公式乘法
2. 研究背景与文献综述
2.1. 研究背景
本文选取的第一个品牌是橘朵;橘朵所属上海橘宜化妆品有限公司,成立于2016年4月5日。2017年4月进驻,2018年8月在天猫开设旗舰店。在2018年有过两轮投资,分别是顺为资本和新宜资本。
自橘朵在天猫上线之后的销售数据都呈上升趋势,尤其在经历2018年双十一之后,销售数量大幅上升。
第二个品牌是完美日记;完美日记的成立于2016年,创始人黄锦峰是逸仙电商创始人的CEO,也是为御泥坊前CEO。其主要针对的消费人为学生党或刚迈入职场的年轻女性,短短三年便在美妆市场占据了巨大份额,近日完美日记完成了最新一轮的融资,其融资估值高达10亿美元,稳坐国产第一彩妆品牌的宝座。我们选取的第三个国产美妆品牌是MAOGEPING,取自其创始人毛戈平的拼音。毛戈平先生是国内著名化妆师,被誉为魔术化妆师,2000年他倾力创建了美妆品牌MAOGEPING。该品牌致力于秉承光影美学理念,针对全球女性不同的面部特征、肤质与肤,提供多种产品及彩解决方案,并为每位女性提供由专业彩妆师所打造的量身定制妆容。虽然MAOGEPING彩妆品牌是国内本土为数不多的高端彩妆品牌,但是这个品牌之前并不是如此的广为人知。在近三年的国货风潮中,毛戈平先生令人赞叹的化妆技术加上多渠道的推广营销,MAOGEPING才真正走进大众视野。
2.2. 文献综述
我国学者从不同角度对目前国产彩妆的营销做了分析。例如刘慧(2015) [1]是通过挖掘分析公司外部环境中的威胁和机会,以及内部环境中的优势和劣势来对营销策略现状进行分析。张茜(2018) [2]是通过资生堂的案例来探讨我国彩妆市场该如何完善营销模式。李天淋、胡健(2019) [3]通过对新零售特征和彩妆行业的特性探索,探讨彩妆行业在新零售的推动下要如何做出改变才能借势消费升级吸引消费者。钱丽艳、陈雅婷(2019) [4]分析了国产化妆品“种草”营销本身存在的问题及国家政策,并对"种草"营
销引导方面提出了相应的的对策。陈红、金秀玲(2019) [5]在消费者行为视角下来进行Z世代消费行为的剖析,并结合产品策略、价格策略、渠道策略等营销方式寻适合化妆品行业的营销策略。王灿(2019) [6]从营销渠道的基本理论入手,梳理了国产化妆品企业营销渠道混乱与资源浪费的困境,最后提出了细分化、精准化、融合化的渠道设计意见。
在基于Python文本挖掘的应用上,我国也有许多学者进行了不同方面的探讨。周建、刘炎宝、刘佳佳(2020) [7]为了解国内外情感分析领域的研究状况,揭示该领域的知识结构、研究热点与发展动态,借助各类软件,对数据库收录的以情感分析为主题的相关文献进行计量分析与知识图谱绘制,张敏(2020) [8]以京东商城某品牌热水器的购买用户文本评价数据为基础,通过构建主题模型进行主题的提取,实现对其倾向性判断以及所隐藏信息的挖掘与分析,为生产商提供指导性建议。拓凯渊(2020) [9]运用python网络爬虫技术对美团网上陕西省六个最具代表性的5A级景区的评论进行爬取,然后通过对数据进行处理,挖掘出游客们对陕西省景区评价隐含的语义,为旅游景点管理者提供决策依据。敖长林、李凤佼、许荔珊、孙宝生(2020) [10]采用两种典型的文本分析方法,分析游客对哈尔滨6个冰雪旅游景点的认知形象、情感形象和总体形象感知,丰富了旅游大数据研究方法,为哈尔滨市冰雪旅游形象塑造提供建议。
林琳等
vba获取textbox的值3. 数据描述和方法
3.1. 数据选取及预处理
我们使用数据采集器从微博、淘宝和豆瓣等平台采集所需的评论词条组成数据。本文一共采集284条分别关于完美日记、毛戈平和橘朵三个国产彩妆品牌的数据用jieba软件预处理。首先将采集到的评论进行分词处理,即依据语义将一句话切分成一个个的词,例如,“我觉得很好用”分词成:“我”“觉得”“很”“好用”。虽然分成了一个个的词,但是句子里有一些没有意义的停词,如例子中的“觉得”,要将其过滤掉,该过程使用一个含有1000多个停词的词库,可以实现停词过滤。分词这一步尤为重要,分词效果的好坏直接影响了后面分析的准确性。依据jieba里自带的词典,文本被分为一个个的词。最后统计了三个品牌的评论词频。截取排序前20的词,见表1。依据统计的各品牌的词频制作词云图,让统计结果更加直观,便于寻主要属性特征。筛选掉无意义的高频词,制作得到词云图,如图1~3所示。
Table 1. Comment frequency of three brands
表1.三个品牌的评论词频
完美日记橘朵MAOGEPING 词序
词频数词频数词频数
1 眼影46 眼影6
2 粉底33
2 营销27 粉丝29 化妆27
3 好看26 消费者26 故宫18
4 颜23 小红书22 手法16
5 质量21 明星21 特别16
6 一般20 美妆16 性价比16
7 腮红20 营销16 感觉15
8 飞粉18 微博16 效果15
9 不好17 小狗16 不会15
10 单17 动物16 粉膏14
11 好用15 好用15 上妆13
12 价格14 李佳琦15 视频13
13 晕染13 彩妆14 毛孔12
14 睫毛膏12 联名14 比较12
15 亮片11 KOL 14 好用12
16 粉质10 种草14 使用12
17 持久10 合作12 产品12
18 口红9 线下12 高光12
19 显9 天猫11 东方12
20 眉膏8 渠道11 喜欢11
林琳 等
Figure 1. Word cloud diagram of Judydoll 图1. 橘朵词云图
Figure 2. Word cloud diagram of Perfect Diary 图2. 完美日记词云图
Figure 3. Word cloud diagram of MAOGEPING 图3. MAOGEPING 词云图
3.1.1. 橘朵热点词分析
从图1中可以看出,消费者对于橘朵评论的关键词基本集中在眼影、质量、价格、营销等字眼上,可以看出橘朵的产品定位于年轻女性,特性就是走性价比、平价路线。
眼影可以说是橘朵的当家产品。在之前各大品牌的眼影盘都集中在9或者12,而橘朵却另辟蹊径,避开了这大热品类,把焦点放在了单眼影和4眼影盘上。相比9或者12的眼影盘合集,单眼影的成本造价势必会降低很多,而且橘朵也因为单眼影的成功推出避开了彩妆眼影盘合集的这一片红海,通过低单价吸引到了第一批学生党、小白领、化妆小白等体。
消费者同样十分关心橘朵的营销。橘朵在网络上的营销是非常成功的,其原因是其巧妙的利用了小红书和微博上的KOL 进行营销。我们知道网络KOL 上的账号级别是金字塔型的,分为四级,从上到下依次是明星、大V 、中小V 和草根。橘朵的投放基本都集中在腰部及尾部的KOL ,而这种小成本的不断投放试错能最快的根据消费者反馈来进行内容投放上的调整输出,而小KOL
对于内容的把握和沟通上来说