畴的归结并总结出4个领域研商一已落成对旅客感知范,旅客感知要素的紧张性举办排序本部门将采用LDA焦点模子对。本的焦点以概率散布的式子透露出来LDA 焦点模子的主旨计思是将文,中的合连举办聚类与降维然后对各个焦点正在文本,题的权重[7从而筹算出主] 体验中攻克极为紧张的身分[49]旅游者心情的维度组成正在旅游者心情。研商多通过访叙、问卷等格式探析旅客感知体验心情维度的,客观事物的心情评议结果针对旅游者对主意田主,极或者颓废心情维度[50]鸠集琢磨测度旅客感知的积。如例,的地感贴心情厉重由欢愉、爱、惊喜3个维度组成[51]Hosany 和Gilbert 的研商指出旅游者的目。的问卷量表来测度旅游者的心情体验[52]黄潇婷研商斥地策画“疾苦-欢愉”心情维度。中心情维度的剖判一直深耕跟着学者们对旅客感知体验,游者心情的粗粒度和细粒度越来越多的学者下手合切旅。断文本举座的心情极性粗粒度心情大凡用于判;对象中完全属性或维度的心情[53]细粒度心情多被用于判决旅客对评论。游感知体验中攻克紧张位子心情精密化研商慢慢正在旅。疾苦、怜悯和踊跃为代表的旅游者心情维度如Nawijn 等琢磨玄色旅游情境中以,度蕴涵5 种负向感情并解析出疾苦心情维,含4 种正向感情踊跃心情维度包,负向感情之间[54]怜悯心情维度则介于正。颓废心情和4类中脾性感修筑旅游者心情轮国内学者李君轶等则以8类踊跃心情、8类,游者心情维度进一步细化旅,的心情体验[55]斗劲全部贯通旅客。的访叙或问卷材料举办归结演绎上述研商多通过研商者对旅游者,心情目标和特质解读出旅游者的。 进程”的定量研商而言关于“旅客感知造成,影响了旅客感知的造成进程[11-12]往往借帮中介变量的格式来发觉哪些要素。少的定量研商这些数目较,客感知造成进程中饰演的脚色固然限度揭示了某些要素正在游,感知造成进程的动态性但并未全画面显示旅客,的多维度的繁杂心情加倍是旅客感知包含。表另,用问卷观察数据这些研商厉重采。幼、观察本钱高、问项有限等题目这类数据获取格式存正在数据样本量,限度性和主观颜色[13]以致研商结论存正在必定的。琢磨旅客感知内部的心情细粒度题目古板的问卷观察格式也无法精密深远。 感知内在的根本上正在上述琢磨旅客,的气象、实质举办了较为体系的研商国表里合连文件也对旅客感知所表征,要素和感知进程两个周围合连研商厉重鸠集正在影响。中其,聚焦于旅游者和主意地层面已有影响要素的研商民多。游动机[21]和媒体散布[22]等方面临旅游者计划的影响正在旅游者层面厉重是个别特质[19]、有趣偏好[20]、旅。23-24]、任事与统治[25]、旅游资源[26]等方面正在主意地层面的研商厉重呈现正在主意地特质[9]、旅游境况[,互动之中天生的关于主意地的理解和意见以为旅客感知是旅游者与主意地合系和,立场的一种响应[27]是旅游者关于主意地心情。体特质的旅客筑构主意地认知和心情的进程旅客与主意地合系与互动的进程即是拥有个,特性化属性对旅客的餍足[28]厉重是主意地的消息性、互动性、。言之简,的成绩足够这些研商,典范格式,全部场景,性强普适,撑本文后续的故事线梳理和表面提炼于是这些紧张的研商结论被用于支。 之总,知进程的研商关于旅客感,依然定量研商无论是定性,知领域的提炼归结均鸠集正在旅客感。根源上正在材料,用汇集评论虽都下手采,延续常用的格式但执掌格式仍。此因,心情交互调理的动态进程审视不敷现有研商关于现实场景中的正负,的细粒度仍较为大略关于心情特质剖判,机造的蜕变性还合切不足关于旅客感知的内正在造成。于此基,格式辅帮讲解范式剖判本文拟采用文本发现,纳旅客感知的合节要素基于海量消息提炼和归,知进程的心情蜕变并中心合切旅客感。 有效户数目超越1 亿携程网与去哪儿网拥,旅客评论数据拥有海量的。分造的评级打分机造两个平台均采用5,级懂得评议层。此因,感知数据根源平台本文将其举动旅客。时同,举动研商区域拣选大连市,我国出名的旅游都市厉重是由于大连是,论数据足够旅客体验评,的代表性好原始材料,较强的研商结论易于造成普适性。百度指数合切度最高的5个出名景区主意地采取了大连市评论数目最多且,棒棰岛境遇区、星海广场、文化和旅游部圣亚海洋全国区别是金石滩境遇区、老虎滩海洋公园、。者再,和筑模所需的原始原料数目商酌到旅客感知的时效性,2020年1月的旅客评论文本本次数据采取2018年1月至。错乱的评论消息剔除掉无用和,客评论文本174 667条总共搜罗到用于文本发现的游。 导游、海滩、门票、垃圾、沙子金石滩境遇区负面感知鸠集于,统治、旅客数目和景区卫生等题目响应出金石滩境遇区存正在景区导游。扮演、措施、门票、职责职员等老虎滩海洋公园负面感知聚焦于,立场差、收费多等题目的感知集合景区措施旧、职责职员,统治不到位证据景区的,、票价和收费等题目不满足同时旅客关于景区扮演节目。理、司机、游览车、宽待、站岗棒棰岛境遇区负面感知缠绕着管,权等题目浮现出景区的统治次第和任事题目卓殊是景区的司机、游览车、宽待、站岗特。现象败兴、统治乱、音笑吵、浴场垃圾等星海广场的负面感知厉重是啤酒滋味、,卫生计正在必定题目证据景区的统治和。队等候久、扮演多、场馆远等圣亚海洋全国的负面感知的排,产物筹划和统治题目侧面响应出景区的。 算法辅帮研商者执掌旅客评论大数据4.1 研商结论本文通过筹算机,式提炼出旅客感知领域并用命质性研商的范。以往研商分别于,部的正亏心情焦点数目和权重本文精密地窥察旅客感知内,词频和语义背后的深宗旨细节描画出旅客感知领域的心情。发觉研商,知是动态演变的旅客的主意地感,征促成包含旅客感知主领域的析出旅客感知子领域内部的正亏心情特。表此,、旅客正负面感知的动态蜕变、旅客感知筑构3个进程旅客感知造成进程搜罗旅游者与主意地的合系与互动,间存正在互相合联且3个进程之。中其,是旅客感知造成进程的根本合节旅游者与主意地的合系与互动,旅客感知造成进程的主旨合节旅客正负面感知的动态蜕变是,蜕变的底子来历是旅客感知动态,感知造成进程的结果旅客感知筑构是旅客。 之总,是一个进程旅客感知,的合系和互动根本之上的是征战正在旅游者与主意地。正负面感知互相斗劲和调理的结果旅客感知造成进程是旅游主意地,地认知与心情的紧张进程是决策旅客对旅游主意。面感知要素的紧张性和优先度正在此厉重是通过斗劲旅客正负,的地的动态感知造成旅客关于目,游进程中央理行动的动态蜕变可靠地响应出旅客正在全体旅。于此基,旅客感知领域的根本上正在充斥商酌前述研商和,成模子(图2)筑构旅客感知形。 感知是若何造成的?——基于文本发现的寻觅性研原题目:《旅游学刊》 史达等:旅客的主意地究 主意地统治的紧张研商周围[摘 要]旅客感知是旅游。材举办人为编码并归结出领域以往研商多基于扎根表面对素,检查来会商其造成机造或以对中介变量的假设。10万余条旅客评论为材料根源著作以大连市5家出名景区的,旅客评分最先遵照,正亏心情维度划分对评论文本举办;k两种算法对景区旅客文本评论抽取合节词然后以TF-IDF 和TextRan,性研商的范式并用命讲解,的子领域和合节领域提炼出旅客正负感知;后随,上述旅客正负感知领域的权重纪律行使LDA焦点模子格式测算出。根本上正在此,效用要素、布局要素和特质要素等领域内包含着繁杂的正亏心情双重维度最终梳理出旅客主意地感知造成进程的故事线)旅客感知的表征要素、,态演变的特质并透露出动。亏心情焦点拥有明显的区别性(2)旅客感知领域内的正。知之间的转换和调理(3)旅客正负感,的地的最终认知与心情动态演绎出旅客对目。地感知造成的动态进程著作筑构了旅客的主意,旅客感知表面的深度拓展了心情细粒度正在,表面研商格式的界限同时拓宽了旅客感知。 。主意地消息之后旅游者正在获取,理天生关于主意地的游前印象通过对主意地消息实质的处。时同,互动为旅客感知供应尤其深远和全部的消息旅游者正在旅游进程中与主意地之间的合系与,、任事与统治、旅游资源之间的合系与互动其厉重呈现于旅游者与主意地特质、境况。子值得去的地方如“去大连带孩,分分析海洋全国让宝宝能够充。幼孩子的玩耍天国(X1202)。确实很美丽的幼岛(Q5547),宜人现象,取静闹中,走走看看值得来!一同来的带父母,也不累渐渐游。8)“澄澈的海水”(X1522,的境遇秀丽,中的棒棰岛孤单于海,胜地度假,传的差不多跟网上宣。07)也即是说”(Q579,与执掌格式导致旅客感知造成和蜕变旅游者关于主意地旅游消息的采纳。而因,虑到旅游者与主意地之间的全程合系与互动关于旅客感知造成进程的研商须要充斥考,的地的正面感知和负面感知并以此发生的旅客关于目。 面感知互相斗劲和调理进程的结果旅客感知的动态蜕变恰是旅客正负,客关于旅游主意地的认知与心情斗劲并调理后的旅客感知塑造游。味着这意,主意地正负面感知举办斗劲旅游者正在旅游进程中一直对,地的评议和体验结果调理旅客关于主意。自此觉得挺好的如“开初到了,斗劲多景点,挺美现象。不须要买联票只然而确实,12博12bet游戏。合去看一下的地质公园才适,馆并欠好其他几个,欢石头蜡像之类的倘若不是卓殊喜,需要买联票真的没有。)“园区人景挺好”(X4169,斗劲好体验,表很窝心然则园。垄断出租车本地无赖,高车价多倍抬,旅客压造,市旅游抹黑给大连城。3)更凿凿地说”(Q245,的地旅客感知造成进程的底子来历旅客正负面感知的区别是旅游目。 的旅客正面感知正在于孩子金石滩境遇区呈现屡次,旅客感知的重心孩子的体验是。语厉重浮现正在动物扮演类词语较多老虎滩海洋公园的合节词和合节短,动物和植物类资源感知较深证据旅客关于海洋公园的。是棒棰岛的景区特性特别的海洋资源景观,海水、海景发生深入的感知旅客关于棒棰岛的海滩、。堡栈房和海鸥是主意地特性星海广场的跨海大桥、城,受国表里旅客的爱好加倍是都市夜景深。扮演是圣亚海洋全国主打的特性项目圣亚海洋全国的海洋极地境况和动物,接感知所正在也是旅客直。 究的效度为确保研,究者基于体会性的预判根基划一研商团队发觉旅客评论消息与研。了三角互证法同时本文采用。访者从分别的视角三角互证法请求采,析评议统一气象或题目让分别的受访者去分,异性对研商的结果都极为紧张他们主张之间的划一性和差。者两个方面来征求合于旅客感知题目的主张本研商从旅客(本地和边疆)、景区统治。区统治者征战起了信赖合连因为研商团队仍旧与本地景,面和可靠的消息于是获取了较全。时同,至10月中旬正在上述5 处景点研商团队正在2020年9月中旬,非正式访叙与旅客举办,合消息获取相。该题目的意见经斗劲两方对,论文本消息划一发觉与汇集评,息牢靠有用汇集文本信。 客评论文本不行够直接运用因为通过汇集爬虫搜罗的游,最先对文本作中文成亲故执掌文本消息之前,论的文字部门只保存旅客评。次其,据去重举办数,部门反复的文本删除旅客评论中,剖判成果普及文本。次再,失数据删除缺。称、旅客评分、旅客评议、评议光阴4个维度搜罗的旅客评论的完美文本理应搜罗旅客昵,文本也许存正在维度不全的景况然则现实上关于每条旅客评论,论无效失真等题目导致部门旅客评,的信度和效度影响到文本。表此,字数特短的语句旅客评论实质中,出旅客的可靠感觉也许无法无误表达,效的特质项和合节词也斗劲难提炼出有。晴等的体会模仿赵宇,个字的评论文本[60删除少于或等于4 ] 是旅客感知造成进程的主旨合节旅游者正负面感知的动态蜕变,验结果的紧张进程是决策旅客感知体。地说确切,要素斗劲和调理的贯通通过对旅客正负面感知,地的合系与互动进程讲解出旅游者与主意,知体验结果的道理并解构出旅客感。水准上正在很大,知要素的窥察与解读借帮对旅客正负面感,客感知的道理寻求和施展游,杂动态心情的贯通增加对旅游者复。而言完全,较正负面感知要素旅游者恰是通过比,的地的认知与心情调理关于旅游目。味着这意,整是感知体验结果的合节所正在旅游者正负面感知的斗劲和调,要素之间的动态斗劲与调理旅客恰是通过正负面感知,认知与心情塑造旅客的,的地的旅游体验以此鉴定旅游目。面感知而言关于旅客正,征要素、效用要素和特质要素厉重散布正在旅游主意地的表;0多公里长的海岸线如“金石滩延绵3,工的地质异景集聚了巧夺天,猛虎扑食、恐龙吞海、贝多芬头像等如惟妙惟肖的大象吸水、大鹏展翅、,撼全国地质学界尤以龟背石震。)“不愧是国宾级的”(X21475,即是海边一下车,呼吸深,人的五脏六腑给冲洗了一遍夹着海水的氛围觉得立马把。常整洁海水非。天合一的现象看着远方海,点都觉得不到热撑把遮阳伞一。必定要去棒棰岛看看倡导到大连的同伴。游主意地的效用要素、布局要素和特质要素等”(X12005)负面感知民多呈现正在旅,布局要素厉重是。假区面积很大如“金石滩度,区大巴进入须要搭乘景,多个幼景区景区内有,斗劲坑有的,区即是一个万福鼎景,让你去拆字然后让你交钱进去后巴士伴随的导游会,人的很坑。游者关于主意地民多处于正负面感知胶着的繁杂形态”(Q42371)旅客正负感知呈现交叉意味着旅。而因,知孰轻孰重就显得尤为紧张进一步辨识出旅客正负面感。者再,感知与负面感知之间的动态蜕变“斗劲”着重于合切旅客正面,杂的心情形态彰显出旅客复。较正负面感知得出新的结果而“调理”则是旅客通过比。如“ 语合节词语或焦点词汇是心情特质探析的根基元素3.1 研商一:提炼旅客感知的合节词和合节短,的特定心情目标包含着旅游者,感定向[69-70表达出旅游者的情] 1可知由表,的均值和尺度差均斗劲平静5个主意地景区的旅客评分,映出旅客感知的根基布局与实质证据旅客评论消息或许较好反。表此,感数据与灰色数据的数目占比上正在5 个主意地景区的正负情,感的感知占比最高星海广场的正向情,可水准较高证据旅客认。心情的感知占比最高棒棰岛境遇区的负向,感知体验相对其他景区较低证据旅客对棒棰岛境遇区的。 ]的研商[74,性、旅游任事属性以及特性化属性等方面主意地属性厉重搜罗吸引物属性、体验属。此因,文特性等子领域厉重为主意地吸引物属性本文所归结的天然资源、生态境况和人,召集出以海景和地标等为代表的正向的盛宴收益特别的海洋资源和特性人文行动(如啤酒节),、卫生等负面收益然则也发生喧嚣,形与无形的吸引物的浮现式子正负收益厉重聚焦正在主意地有,表征要素故归结为。验等子领域厉重为主意地体验属性而主意地及旅游资源体验、心情体,浓重的文娱歇闲气氛多样的吸引物带头,兴等为代表的正面心情体验晋升旅客以可爱、痛快、高,反相,舞台节目消重旅客体验简单的状况剧和反复的,验不佳的负面收益带来扮演欠好、体。旅客的主观效用判决这些正负面收益常为,为效用要素于是归结。表另,光阴安置等子领域厉重为主意地旅游任事属性景区统治、景区筹划、辅帮任事、内交际通、,任事的典范与尺度主意地整合统治和,卫生、根本措施等厉重与辅帮任事的请求餍足旅客关于景区统治、任事宽待、境况,便当、光阴方便等正面优质任事为旅客打造出挂念品多、购物,人、统治差等的多层级统治与任事题目同时也浮现出配置旧、立场差、宽待坑,负面收益带来旅客。题透露超群层级、多方面的布局性特质这些涉及主意地景区统治与任事的问,为布局要素于是归结。后最,子领域厉重为特性化属性旅客特质与景区特质等,亲子与家庭旅游以孩子为代表的,孩子适合、孩子痛快等正面收益多合切孩子的有趣和特性带来的。海岛幼等为代表的景区特质而以特权站岗、司机车多、,的负面收益则引致旅客。与景区特质归并为特质要素李春晓等将旅客个别特质,畴的要素[13]举动旅客感知范。纳为特质要素本文也将其归。此因,效用要素、布局要素、特质要素等4个感知领域本文最终将12个子领域归并成为表征要素、。为“主意”这4个领域,子领域)是旅客所合切的它决策哪些“结果”(,键词和合节短语)是紧张的(图1)最终决策哪些“主意地属性”(合。 。出旅客由负面到正面的调理进程”(X20145)此处浮现。斗劲澄澈如“海水,是太多人也不,斗劲大沙岸,挺不错的看起来,区较远但离市,这里的话不太值得倘若零丁只为来,水浴场玩玩就能够了不如正在市区内的海。现出旅客由正面到负面的调理进程”(Q14967)而正在此处体。此因,旅客对旅游主意地繁杂的认知与心情旅游者正负面感知的动态蜕变彰显出,知的紧张要求是筑构旅客感。客感知的筑(3)游构 并集合汇集评论文本的特质本研商用命质性研商的典范,发展研商:最先依据如下次序,举办提纯对文本,的文本数据以得回及格;次其,贴上“心情标签”对旅客评论文本先,旅客心情评论划分正负面的,客的感知形态以此划分游;后然,研商一举办,法举办合节词提取行使文本发现方,于盛开式编码该项职责类同;着接,来贯通合节词施展的道理研商者通过讲解性研商,举办子领域归类再对这些合节词,出领域并总结。均由研商者人为举办子领域与领域的提炼。归结出合节词研商一固然,紧张性的区别但并不晓畅其。数研商中正在民多,码默以为权重相当往往将盛开式编。过人为统计的格式已有少少研商通,本中的比例[59]筹算子领域正在某文,码互相间的紧张水准但仍未能得回各编。理出的4 个领域为根本故研商二以研商一所梳,绪中各合节词(编码)的紧张性区别进一步透露出旅客正负两种感知情。表此,一个用意正在于研商二的另,究一的合节词提取是否确切通过更调算法再次验证研。后最,究的根本上正在上述研,成进程的故事线)数据提研商三梳理出旅客感知形纯 料的信度看从原始材,为拥有独立道理的文本实质旅客正在线评论消息可被视,感知的表达是旅客可靠,正在信度[57]拥有优秀的内。饱和性请求看从原始原料的,材料的进程中正在整饬剖判,是否存正在缺陷或者不敷本文一直反省已有材料。集了携程网的数据本文正在初期仅收,消息足够的案例来举办深度研商鉴于主意性抽样的逻辑正在于拣选,究主意至合紧张的消息[58]研商者从中能够得回良多对研。携程网打分机造犹如后又增加搜罗了与,的去哪儿网数据但用户群体分别。论的随机浏览以及长篇幅评论的中心阅读最终通过对2018—2020年合连评,不再供应新的消息以为新的素材已,抵达饱和原始原料。 。ank两种算法常集合运用TF-IDF与TextR,论实质的合节词交叉验证旅客评,词时确切性和全部性的不敷能够填充简单算法发现合节,出旅客的可靠感知从而明了地透露。性跟着其正在文献中呈现的次数成正比推广TF-IDF的主旨计思是:字词的紧张,中呈现的频率成反比低重但同时会跟着其正在语料库。景况下大凡,现频率越大合节词出,就会越大TF 值,的比重就会越多其正在文档中所占,也就越紧张性高 指出的是①须要,法的分别由于算,一获取的合节词并非逐一对应研商二获取的焦点词与研商。和表3的实质但比对表2,两个维度均存正在极大的近似性可发觉正在领域归属和心情归属。了研商一的结论这也交叉辅证。。领域的紧张性差表3 旅客感知异 究证据已有研,旅游者获取主意地消息旅客感知造成进程始于,互动是旅客获撤除息的合节所正在旅游者与主意地之间的合系和,程的根本合节[67也是旅客感知造成过] 价格来界定旅游感知的内在国表里学界多以旅游体验。值3 个维度修筑旅客的感知价格[14]郭安禧等以实体价格、经济价格和练习价。样地同,i以韩国为研商区域Choi和Cho,认知和心情的影响[15]研商旅游体验价格对主意地。者再,非物质文明遗产的感知Qiu 等通过旅客对,的举座意见和立场[16]以此筑构关于旅游主意地。体地更具,ca[18]通过研商旅游主意地品牌的视觉和言语标识等符号Shao等[17]、Gretzel和De Mendon,影响到旅客感知主意地品牌的进程指出旅客对符号标识的解读进一步。 表此,的单模态数据举办寻觅性研商本文厉重缠绕旅客评论文本,片、音视频等多模态数据后续倘若或许同时执掌图,感知进程的研商更充斥会使得旅客的主意地。次再,程是一个心境行动由于旅客感知过,知神经学等合连表面后续研商还可借帮认,配置举办试验研商采用眼动、脑电等,有深度的结论也许会发觉更,后续勤苦的偏向这也是本研商。后最,大连市)举办寻觅性研商本文厉重对简单案例(,举办验证与增加尚未采用多案例,他案例的佐证和美满研商结论也许缺乏其,和故事演绎方面拥有明显上风而多案例研商正在研商情境还原。结论的普适性商酌到研商,展到多案例研商后续研商将拓,究结论的界限拓宽本文研,化表面进献进一步深。 文本“贴心情标签”本部门对旅客评论。打分结果看从旅客的,布不屈衡各分值分,的评论数斗劲少1 分和2 分。此因,论文本的平均性为普及旅客评,等的格式[13本文模仿李春晓] 游者心境和行动的出发点旅客感知举动研商旅,知觉的归纳体是旅客觉得和,境况等消息所得回的心境认知进程[3]通过多感官体验主意地旅游资源、旅游,息转换为内正在思想的进程[4]也是旅客将表部的主意地旅游信。可见由此,是一个进程旅客感知,的合系和互动的根本之上并征战正在旅游者与主意地。么那,爱”或“憎”吗?一个给出高分评议(结果)的旅客这个进程是若何演化的呢?旅客感知从始至终老是“,ourt 和Lupton指出就没有“不痛快”的时辰吗?C,主意地旅游消息实质的执掌格式[5]旅客感知的造成和蜕变正在于旅游者对。方面一,息源拥有无偏性主意地举动信;方面另一,授与和执掌拥有区别性和能动性旅游者关于主意地旅游消息的,化的旅客感知的造成进而导致各异且变。而因,到旅游者体验的动态性及其心情立场之区别性对旅客感知造成进程的研商就请求充斥商酌。 果而对感知领域的讲解基于旅客感知体验结,引力?旅客从分别的旅游景区得回了哪些收益?这些收益为什么紧张?即厉重基于如下阶梯法的斟酌递次打开:旅游主意地的哪些要素发生了吸,到产物或任事属性的体验结果由完全的旅游主意地属性概括,到结果天生价格再进一步概括,感知的多宗旨动态进程自下而上地演绎出旅客。禧等[73遵照郭安] 成机造的合连研商现有对旅客感知形,根表面、民族志等定性格式多采用基于深度访叙的扎。性研商的紧张格式扎根表面举动质,及观念的梳理和领域的提炼厉重是对访叙材料的编码以。贯串性、较长篇幅的这些访叙材料往往是,料往往不予商酌而对片断化的资。窥察发觉体会性的,上均是“只言片语”洪量旅客评论到底,的“旅游攻略”而非整饬典范。化的评论这些碎片,验进程中的动态心情蜕变也许响应了旅客正在旅游体,滤执掌[6]但往往都被过。长篇幅旅游攻略关于完美形状的,的“水军软文”除表除了也许是业内知悉,容许揭晓主张的旅游者的意见这些长评论鸠集响应了那些。的角度看从统计学,着内素性的过错其代表性存正在。 感知造成进程的研商中正在为数不多的对旅客,的视角窥察从研商格式,性和定量研商两类可较明了地分为定。中其,要以扎根表面为主定性研商格式主。访叙材料或者问卷为主早期多以简单的实地,面感知的简单访叙原料编码提炼出7大领域和22 个幼领域如高军等通过12个入境都市的623句问答的表国旅客负,感知进程[29]修筑入境旅客负面。用问卷的格式熊伟和胡洋采,念的感知进程[30]琢磨旅客对非营利理。后此,接收汇集文本材料扎根研商慢慢下手,汇集文本集合运用并将访叙材料和,7 条汇集点评琢磨旅游意象感知进程如高楠等行使103 篇访叙和470,个感知领域[31]归结总结出13 。料和汇集文本等多材料源张红梅等集合实地访叙资,7个旅客感知领域[32]通过扎根格式提炼归结出。表此,究仅采用汇集文本消息也越来越常见质性研, 条和民多点评网2145条旅客点评如白丹等通过搜集携程网评论3480,个主领域和32个领域行使扎根格式归结出5,知评议进程编造[33]筑构遗产主意地的旅客感。长纪行文本为材料根源王君怡等以26篇汇集,个厉重领域和19个对应领域采用扎根表面的格式提炼出8,的认知进程[34]琢磨主意地旅游情景。及了旅客感知进程上述研商即使涉,旅客感知领域但仍正在于提炼,并非研商的中心感知进程往往。表此,为普遍地集合多种素材研商材料即使仍旧较,仍是旅客感知的静态结果但正在编码后厉重呈现的,进程的研商依旧少见关于旅客感知动态,异性的研商仍显不敷关于旅客感贴心情差。 数据正在旅游周围的行使慢慢上升[41-42]旅游者通过社交媒体或者正在线网站天生的文本。现的光阴递次而言就文本剖判格式出,义剖判、文本发现算法等3种格式大致搜罗人为编码、ROST语。要的文本剖判格式人为编码仍是重,机械编码所取代也不也许一律被。时同,消息的海量化鉴于旅客文本,采用ROST语义剖判用具研商者仍旧下手较为屡次地,理和语义汇集图告终高频词处。免了研商者的主观要素和预设思法固然ROST 软件必定水准上避,效度题目[43]但存正在较要紧的。词语为参考或者遵照辞书举办词频统计ROST 语义剖判以合节词、主客观,常用词语的词频过高常形成专属名词和,掘出评论焦点未能深度挖,论中有效的消息斗劲容易粗心评,剖判的偏差推广了后续。宫的文本研商中比方正在对北京故,宫”和“北京”[8]呈现词频最高的是“故。际上而实,并非旅客的合切点这两个高词频也许,评论进程中只然而正在,个地舆身分云尔须要多次夸大两,是“雪景”或“纪念”旅客真正眷注的也许。似地类,客心情特质研商中正在天门山景区的游,山”和“景区”[9]词频最高的是“天门,词的“旅游”或“索道”被弱化也许导致本应是汇集合系中央,论也许呈现过错由此形成研商结。于算法的来历极易成为研商盲点那些本应被优秀的合节要素由。 感细粒度研商中的深远行使跟着筹算机技能正在旅游者情,来划分旅游者心情维度通过“贴心情标签”,感体验区别的常用格式成为深远研商旅游者情。事先贴上正负向心情两类标签比方李春晓等将旅客评论数据,的合节要素和心情特质区别[13]然后区别发现旅客正负面心情体验。犹如与之,澳大利亚主意地的正在线评议Liu等通过中国旅客对,旅游者“贴心情标签”以心情辞书的格式为,与国际旅客的心情特质区别[43]据此琢磨中国旅客的心情画像以及。技能探究旅游者感知体验的心情维度“贴心情标签”现实上是借帮大数据,感的细粒度和动态蜕变[56]有利于透露出旅游者正负面情。时同,利于深远贯通旅游者的行动特质和表达目标基于大数据技能琢磨旅客感知的心情维度有,旅游者的内正在心境机造正在很大水准上描绘出,深远明白[49]是对旅游体验的。感标签”的根本上本文拟正在“贴情,心情的蜕变进一步合切。游体验结果上看由于倘若仅从旅,是“爱憎稳固”旅游者宛如总,种心情的稳态永远处于某,心情蜕变的足够性并不划一而这与惯常的旅游体验中。此因,心情维度的区别化本文拟重视旅客,为根本并以此,转换的动态心情进程合切旅游者“爱憎”。 属性宗旨最先是。区的产物属性看从上述5个景,景观)亲密合连均与海(天然,星海广场、棒棰岛)有的着重于鉴赏(如,(如老虎滩、圣亚)有的着重于焦点公园。地属性看从主意,交通方便大连市内,怡人天气。宗旨看从结果,结果占比斗劲高旅客感知的正面,果占比低负面结,几个维度(表1)且厉重鸠集正在少数。值层面看从感知价,现象不错既有“,好打趣趣,比高性价,一体玩耍,海洋馆扮演卓殊是极地,客鉴赏值得游,具一格水城别,没有犹如场正在其他地方,超赞总体。如此的正面便宜所得”(Q2154),色很大凡也有“景,可玩的也没啥,是人全,标识差景区,不限流五一也,多的门票390,便找个海边走走还不如随苟且。大凡现象,性低可玩,比低性价,校正有待。)之类的负面亏损”(Q1234。 所述承前,畴的根本上(研商一)正在提炼出旅客感知范,焦点的紧张性区别(研商二)集合旅客感知领域内部心情,面感知的动态起色举办合系将这些领域缠绕着旅客正负,旅客感知内在的紧张研商成绩并遵照1.1 部门整饬出的,造成进程的故事线梳理出旅客感知,客感知造成模子最终修筑出游。 到的合节词和合节短语上述通过文本发现得,步观念化取得的编码结果犹如于盛开性编码经初。掘的结果与人为编码结果之间不呈现过错为确保本文基于海量碎片化的文本举办挖,算法抽取旅客评论实质得回的高频合节词放宽到前50个本文将通过TF-IDF 与TextRank 两种,长篇幅汇集评论然后选用部门,和观念化的格式采用人为贴标签,键词根基类同的观念得出与50个高频合。此因,施展的道理归结出12个子领域笔者基于贯通合节词和合节短语。中其,的地及旅游资源体验、心情体验等将旅客正面感知的子领域归结为目,总结有意情体验、生态境况等将旅客负面感知的子领域归结,图1详见。出的是须要指,正在归结和领域化之后旅客正面和负面感知,全划一的子领域并未区别得出完,于人为编码更细腻故其划分度相较,成进程的深远探究更有帮于对感知形。 1][7。用词语和专属名词以及特定所在词语但文本评论实质蕴涵较多无道理的通,其他合节词的紧张性减少了旅客评论中,则响应出合节词的广博水准而逆向文本频率IDF 。此因,于普及紧张合节词的权重TF-IDF算法有帮。样地同,过词语之间的相邻合连修筑汇集TextRank算法厉重通,节点的Rank 值然后筹算每个汇集,nk值提炼出合节词最终通过排序Ra。于语料库的依赖水准大TF-IDF算法对,接对旅客评论素材逐条举办剖判而TextRank算法能够直,到合节词进而得。此因,Rank 算法合伙提炼旅客评论的合节词通过集合行使TF-IDF 与Text,旨更清爽的合节短语将合节词拓展成主,词的信度和效度[72]进一步验证旅客评论合节。此因,5 个高频合节词和合节短语本文抽取出旅客评论实质前,2所示如表① 本发现算法得出的合节词实质剖判法不适合解读文,此因,范式[61-63模仿讲解性研商] 的根本上发觉题目依循“正在原始材料,法”的质性研商范式并寻求题目的处分方,料的整饬和阅读合节正在海量原始碎片资,机文本发现算法借帮成熟的筹算,举办质性编码辅帮研商者,执掌大数据的特质既优秀机械算法,察和深远斟酌方面的上风[7]又充斥施展质性研商正在材料观。研商中正在质性,为两个不成或缺的前撮要求研商者的常识性和智能性。创作等对“智人”请求极高的周围的告捷行使鉴于数据执掌技能仍旧正在围棋、作曲、新颖诗,这类相比拟较简略的数据执掌对象数据发现格式应该胜任“文本”。实其,imancer 等语义剖判软件对互联网文本举办剖判质性研商的用具近几年也下手较多采用ROST、Lex,格式上寻求表延和拓展[8]这仍旧显示出研商者正在研商。T 算法是固化的然则因为ROS,举办形容性统计往往只是对词频,者景点名并以静态结果为主高频词广博鸠集正在地名或,合节词汇和心情蜕变淡化了旅客感知的,结论过错[9]也许导致研商。 document frequency)是一种厉重用于文本发现的常用加权算法而TF-IDF①TF-IDF(term frequency-inverse,equency)指词频TF(term fr,t frequency)指逆向文本频率IDF(inverse documen。掘出旅客可靠感知的统计特质此类成熟的算法能很好地挖,果的心情细粒度[10]深远剖判旅客感知体验结。正在多个编程软件中被随时移用并且这些算法及其优化版能够,机专业人士运用出格便于非筹算。 对旅客感知举办归类[64-68]范式,编码结果举办梳理和讲解故本文根据该表面对机械。属性-结果-价格”的链条“途径-主意”表面多从“,性与旅客价格之间的合连夸大主意地产物或任事属,为抵达主意的格式将主意地属性视,客价格趋势响应出游。属性与旅客价格之间的桥梁而旅客体验结果举动主意地,果与旅客价格结合起来[64]将旅客对主意地属性的体验结。而言完全,的地的产物或任事属性层是旅游目;产物或任事属性发生的体验结果结果层形容出旅客通过主意地;值观和理性形态[65]价格层描绘出旅客片面价。游者来说关于旅,旅游体验结果旅客价格源于,对主意地属性的感知评议旅游体验结果呈现正在旅客,决策要素[66]是旅客价格的厉重。等以为张宏梅,-主意”范式遵照“途径,验结果-旅游者的价格观和终极形态”这一宗旨合连主意地旅客感知价格存正在“主意地属性-主意地体,主意地体验分宗旨剖判并且将主意地属性与,道理[67]更拥有指示。别地特,价格”链条中的价格的权衡关于上述“属性-结果-,aml 对顾客价格的界说多半研商采用Zeith,付出的本钱举办量度后对产物或任事效用的总体评议[68]以为顾客价格是顾客感知到的便宜与其正在获取产物或任事时所。用此观念本文将采,顾客关于本钱的量度由于该界说夸大了,较的心境进程优秀了动态比,究主意相吻合与本文的研。上综,途径-主意”范式本文厉重根据“,所赋能的主意地产物、任事等属性举动互动根本将旅游主意地的特质、境况、资源与统治等要素,天生的旅客评论作为感知体验结果将旅游者与主意地属性的合系互动,度为表征的旅客感知进而寻觅以心情维。 对上述文本的执掌结果为了窥察比对ROST, CM6 软件举办剖判本文通过运用ROST,35、扮演19 742、孩子19 335、海洋18 324、景点13 148测得旅客正面感知词频挨次是大连32 994、广场26 480、公园24 4;3、海洋馆1302、列队1173、门票1098旅客负面感知词频挨次是大连1385、景区131,nk 两种算法得出的结果存正在较大区别与本文TF-IDF 与TextRa。海洋等身分高频词语经人为抽样阅读查对因为ROST提炼的大连、景区、广场、,焦点要素发觉并非,焦点要素的弱化于是导致其他。。的合节词和合节短表2 旅客感知语