您的位置:久久首頁> 男性> 解讀男人> 職場男性> 職場風(fēng)云 >概況

人機(jī)對話測評:理論、方法及其問題

發(fā)布時間: 2015-11-02 17:14:48      來源:有問必答健康社區(qū)

用手機(jī)掃描二維碼在手機(jī)上繼續(xù)觀看

什么是自體免疫性肝炎
手機(jī)查看
導(dǎo)

人機(jī)對話:人才測評領(lǐng)域中的新變革信息化是一場革命。它帶來人與人之間交往方式的改變和人類思維方式的轉(zhuǎn)換。因為“社會(不管其形式如何)究竟是什么呢?是人們交往的產(chǎn)物?!毙畔⑸鐣?、網(wǎng)絡(luò)社

一、人機(jī)對話:人才測評領(lǐng)域中的新變革
信息化是一場革命。它帶來人與人之間交往方式的改變和人類思維方式的轉(zhuǎn)換。因為“社會(不管其形式如何)究竟是什么呢?是人們交往的產(chǎn)物。”信息社會、網(wǎng)絡(luò)社會、虛擬空間的興起,加強(qiáng)了人們之間多方面的交往,促進(jìn)了人們豐富的社會關(guān)系的形成,對于人的發(fā)展有極大的影響:信息化創(chuàng)造的“虛擬實在”環(huán)境為人們的角色實踐提供了絕好場所,人們可以在其中進(jìn)行“角色換位”,把自己假定成不同的角色,體會不同角色的需求和情感并按自己理解的角色規(guī)范進(jìn)行角色實踐,并通過網(wǎng)絡(luò)社會的信息反饋驗證自己的角色行為,把握自己在現(xiàn)實生活中扮演各種角色的尺度。概言之,信息化帶來交往方式、生存方式、教育方式等多方面的變革,為人格、能力的提升提供了進(jìn)一步發(fā)展的可能性, 也帶來人才測評理論與方法范式的重大轉(zhuǎn)換。

信息化表現(xiàn)在人力資源管理領(lǐng)域,就是hr流程的“e”化。各類人才測評軟件的開發(fā)與運用,是其中的一道道風(fēng)景線。這些建構(gòu)在人工智能、信息技術(shù)、高級程序語言、多媒體技術(shù)等基礎(chǔ)之上的測評工具,不僅將一般的測評手段“e”化,更使之得以建筑在強(qiáng)大的技術(shù)平臺之上,大大提升了一般人才測評方法的應(yīng)用范圍。直截地說,人機(jī)對話就是一般人才測評的理論與方法在計算機(jī)和網(wǎng)絡(luò)中的實現(xiàn),這一再現(xiàn),具有重大的現(xiàn)實意義:當(dāng)信息技術(shù)取代人的操作時,它使測評任務(wù)或流程自動化;當(dāng)信息技術(shù)拓展人的工作時,它使測評任務(wù)或流程信息化;當(dāng)利用信息技術(shù)進(jìn)行重組時,它使測評任務(wù)或流程發(fā)生根本變化。

一般的人才測評,需要在一種真實、身臨其境的刺激-反應(yīng)條件下實現(xiàn)。然而,在實際的人才測評中,這往往是可望而不可即。因為現(xiàn)實中的許多情景可遇而不可求。比如地震、山洪暴發(fā)等突發(fā)事件對個人應(yīng)急能力的考驗,就具有不可預(yù)料性。有些情景即使能夠刻意制造,也代價甚高且會對測試雙方構(gòu)成威脅,比如針對飛行員的培訓(xùn)和測試。這些局限性在其他領(lǐng)域中同樣存在,并促使人們發(fā)展現(xiàn)實模擬情景的新途徑。計算機(jī)技術(shù)的發(fā)展,使得這一歷程能夠在虛擬空間大行其道。人機(jī)對話測評,正是對信息化對測評傳統(tǒng)理論與方法挑戰(zhàn)的響應(yīng)。它不僅能夠使得受測對象獲得自我認(rèn)知,還可以使之在對話過程中獲得學(xué)習(xí)經(jīng)驗;它不僅僅是一個測評的過程,還是一個學(xué)習(xí)的過程。由于人機(jī)對話具備眾多其它測評方式所難以具備的優(yōu)點,故而獲得了各方面的普遍認(rèn)同。這從網(wǎng)絡(luò)測評的風(fēng)行可以窺出,它折射了大眾對人機(jī)對話測評的認(rèn)同和參與。近年來,人才測評界推出了眾多針對不同測評對象的測評軟件。測評技術(shù)中的心理測驗、專業(yè)筆試、系統(tǒng)仿真及人工智能專家系統(tǒng)等,都在人機(jī)對話中得到初步實現(xiàn)。所有這些,都昭示著人機(jī)對話在測評中運用的廣泛前景。

二、人機(jī)對話:對一般人才測評方法的提升
一個常有的誤解是:人機(jī)對話不過是把人才測評的方法搬到計算機(jī)上罷了,看起來似乎和一般人才測評方法的運用(以人與人之間的互動為基礎(chǔ))沒有什么不同。的確,以往人才測評各方法的運用,多以人與人之間的直接互動為基礎(chǔ),即使是紙筆測評等貌似間接互動的測評,也不過是借助一種或幾種中介物來進(jìn)行“刺激-反應(yīng)”式測評。這種測評的直接互動基礎(chǔ)從哲學(xué)的角度——尤其是馬克思關(guān)于人類社會發(fā)展的廣義劃分類型看,是有其局限性的。因為傳統(tǒng)社會的根本特征是以人與人之間的依賴關(guān)系為基礎(chǔ),在這種社會,通過直接的人——人互動的鏡子,確實能夠較準(zhǔn)確地反映“鏡中之我”。但在信息化時代的市場經(jīng)濟(jì)條件下,社會的本質(zhì)特征轉(zhuǎn)化為以人對物的依賴為基礎(chǔ)。在這種社會,人與人之間的關(guān)系在某種程度上以物——人——物的互動為基礎(chǔ)。從表面看它反映的是物與物之間的關(guān)系,但其實更深刻地折射出人——人之間的社會關(guān)系。 這是一個否定之否定。在信息社會,這面鏡子就是“虛擬實在”(錢學(xué)森稱之為一面“靈鏡”)。表現(xiàn)在測評手段的變化上,就是以網(wǎng)絡(luò)化、信息化為基礎(chǔ)的人機(jī)對話測評方式的崛起。不過在人機(jī)對話的背后,人機(jī)關(guān)系的背后,依然是人與人之間的社會關(guān)系在作祟,只是這種社會關(guān)系通過虛擬空間表現(xiàn)出來而已。

無論是從設(shè)計過程、運作程序,數(shù)據(jù)的收集和處理、測評結(jié)果解釋、解釋的話語系統(tǒng)等外在方面進(jìn)行比較,或是從測評的理論依據(jù)與技術(shù)基礎(chǔ)審視,不難看出:相對于一般的人才測評方法,“人機(jī)對話”方法并不是一種特定的測評方法,而是諸多人才測評方法在計算機(jī)上的再現(xiàn)。它能夠?qū)崿F(xiàn)對一般人才測評方法的綜合,并為之提供更廣闊的施展舞臺。這種再現(xiàn)憑籍的并非純粹的技術(shù),而是出于對新的社會互動基礎(chǔ)趨勢的把握,出于對一般測評方法的優(yōu)點和缺點在信息時代應(yīng)有的改造。一般的測評方法如面試、公文處理等,固然各有相對的優(yōu)勢和適用的領(lǐng)域,但也有著共同的缺點,而人機(jī)對話,則正好能夠從各個方面對之予以提升:

其一,經(jīng)濟(jì)上的制約。有些測評方法之所以被認(rèn)為是適用于“高級人才”測評,不僅僅在于它是多么科學(xué)、典雅、可靠,而常常出于一個很現(xiàn)實的考慮:經(jīng)濟(jì)原因。例如,評價中心技術(shù)集無小組討論、公文處理、結(jié)構(gòu)化面試等測評方法于一體,整個實施過程要耗費很多人力、物力和時間,且對施測方的要求很高。簡言之,經(jīng)濟(jì)因素決定了許多人才測評方法實施的難度,制約了其適用的范圍。而人機(jī)對話則在某種程度上能夠化解類似的窘?jīng)r。人機(jī)對話測評系統(tǒng)由于具有強(qiáng)大的數(shù)據(jù)處理和情景模擬能力,能夠模擬現(xiàn)實中的諸多測評方法,使測評能夠隨時隨地大規(guī)模進(jìn)行。規(guī)模效應(yīng)首先帶來的是測評經(jīng)濟(jì)成本的節(jié)約和機(jī)會成本的降低。

其二,人為因素的干擾。人才測評的客觀性、科學(xué)性,從某種程度上取決于測評方法的適當(dāng)選擇及正確運用。不過,有些人為因素的干擾和方法本身無關(guān),卻只和方法所運作的技術(shù)平臺相關(guān)聯(lián)。譬如,人才測評追求信度、效度的努力一直都在進(jìn)行。如何在測評中最大限度地做到價值中立、過程客觀、程序公平,往往令人頭疼。一個典型的例子是高考錄取。其間的制度措施不可謂不多,但往往難盡人意。自實行網(wǎng)絡(luò)遠(yuǎn)程錄取和網(wǎng)上錄取公示制度后,那些曾經(jīng)傷心的故事就很少發(fā)生了。 人機(jī)對話對許多測評方法的境界提升,就表現(xiàn)在這里。它能夠在事先充分考慮人為因素的干擾,采取技術(shù)手段予以屏蔽和排除,并“逼迫”整個測評的理念與制度發(fā)生變革;而另一個關(guān)鍵好處是:它即使不能夠完全排除人為因素的干擾,至少也能夠明確測評的信度與效度究竟如何,該怎樣不斷改進(jìn)。一句話,在不可避免的謬誤面前,人機(jī)對話能夠使我們比較容易地明白:錯誤的幅度有多大,犯錯誤的概率有多大,規(guī)避的關(guān)鍵措施在那里。而這些,都曾不同程度地困擾著一般人才測評方法。

其三,作坊式運作的尷尬。一般的人才測評,即使是對眾多測評方法的組合運用,往往擺脫不了作坊氣息。這是因為:從根本上說一般的人才測評方法無法不建立在經(jīng)驗、直覺的判斷基礎(chǔ)之上。經(jīng)驗和直覺是很重要的,但又是遠(yuǎn)遠(yuǎn)不夠的。譬如,一個老農(nóng)民通過嘴巴品嘗出哪種玉米是土玉米哪種玉米是雜交玉米,和一個研究者通過基因測試對這兩種玉米品種的鑒別,結(jié)果似乎是差不多,他們都鑒別出了玉米的品種,前者的過程或許還更快更直接。但其中科技含量是不一樣的。因為這些測評基本上不能夠獲得準(zhǔn)確而詳盡的數(shù)據(jù),更不用說建立測評研究的數(shù)據(jù)庫了。這就決定了傳統(tǒng)測評的實施不能夠循序漸進(jìn),測評各方法之間的組合常常貌合神離,難以獲得整體合力。表現(xiàn)在測評領(lǐng)域,就是測評各行業(yè)間各自為政,老死不相往來;各類人才測評的常模難以建立;種種測評獲得的寶貴數(shù)據(jù)閑置而不能夠共享;人才測評在各性別、各年齡、各地區(qū)、各行業(yè)之間缺乏定量比較……。由于沒有強(qiáng)大的人才測評數(shù)據(jù)平臺的支持,作坊式測評年復(fù)一日,難以和國際接軌,不能和國際交流、競爭。譬如,幾個著名的西方測評咨詢機(jī)構(gòu)之所以能夠所向披靡,很大程度在于其實踐的背后各有長期積累的數(shù)據(jù)平臺的支撐。而反觀國內(nèi),分割式測評、單一化測評、游戲式測評,比比皆是。這種現(xiàn)狀制約了測評事業(yè)的可持續(xù)發(fā)展?!叭藱C(jī)對話”測評方式的運用則可能逐步擺脫這種傷感的局面。因為它能夠不斷地收集測評數(shù)據(jù),形成強(qiáng)大的測評數(shù)據(jù)庫;它能夠?qū)崿F(xiàn)網(wǎng)上測評數(shù)據(jù)的交換,為測評提供數(shù)據(jù)支撐,使測評從間斷流程轉(zhuǎn)換為連續(xù)流程……。一言以蔽之,人機(jī)對話是使作坊式測評邁向數(shù)字測評時代的前奏。

其四,應(yīng)對時代召喚的困惑。信息化社會的到來,為人才測評提出了新視角、新思維,也帶來了測評方法的新問題、新思考。例如,網(wǎng)上辦公的流行,數(shù)字化社區(qū)的建成,信息化政府的建設(shè)等,已經(jīng)對人們的觀念產(chǎn)生了巨大沖擊。它呼喚著測評方法、內(nèi)容、形式的新發(fā)展。人機(jī)對話則為響應(yīng)這一挑戰(zhàn)提供了新思路。一般的人才測評方法,尤其是心理測驗的方法,在人機(jī)對話中的運用是很廣泛的。這不僅是因為心理測驗的量表比較容易實現(xiàn)人機(jī)對話,還在于心理變遷作為現(xiàn)代社會高速變遷的折射,常常在人自己身上反映得更深刻。 在一個轉(zhuǎn)型的社會,最深刻的變化莫過于人的變化。人才測評要抓住根本,就要看到:人的根本就是人自身。信息社會的人才測評需要適應(yīng)人自身的深刻變化,就必須對測評的動態(tài)性、追蹤性、人性化、服務(wù)性、便捷性、簡捷性、長期性、指導(dǎo)性等作出響應(yīng)。而這諸多的新要求,恰恰是一般測評方法捉襟見肘,難以應(yīng)對的。人機(jī)對話及其技術(shù)的發(fā)展,則為測評領(lǐng)域中這些難題的解決提供了部分答案。網(wǎng)絡(luò)交往的動態(tài)性、人機(jī)對話的交互性、人機(jī)界面的日漸人性化、計算機(jī)數(shù)據(jù)處理及仿真模擬能力的日益強(qiáng)大等,使得一般的測評方法在人機(jī)對話中不斷獲得新內(nèi)涵、新形式。譬如,針對領(lǐng)導(dǎo)人才素質(zhì)測評而運用的公文處理測驗,就應(yīng)該而且可以在網(wǎng)上實現(xiàn)。因為許多政府機(jī)關(guān)已經(jīng)實行了無紙化辦公,它和傳統(tǒng)的公文處理有很多不同之處。從長遠(yuǎn)看,這就不僅僅是改變測評內(nèi)容所能夠勝任的了,它必須轉(zhuǎn)向人機(jī)對話這種測評方式。

三、人機(jī)對話:理論依據(jù)及其特點
人機(jī)對話不僅僅是一種純粹的技術(shù)表現(xiàn),它同樣有自己發(fā)展中的理論依據(jù)。認(rèn)識到這一點,對于正確認(rèn)識人機(jī)對話測評的相對優(yōu)勢及其可能的缺點,不無裨益。在一般人才測評方法的理論假設(shè)之外,人機(jī)對話所憑籍的理論依據(jù)還包括:

認(rèn)識心理學(xué)理論。認(rèn)識主義心理學(xué)靠造行為主義心理學(xué)的反起家,帶來了心理測驗理論的新發(fā)展。 它使心理學(xué)和計算機(jī)結(jié)合,產(chǎn)生人工智能這一全新的領(lǐng)域;它用信息加工的觀點來解釋人的心理過程,較行為主義心理學(xué)的假設(shè)已經(jīng)是大大前進(jìn)了一步,使測評的假設(shè)由“刺激??反應(yīng)式”轉(zhuǎn)化為“產(chǎn)生式”;它借用了信息論、控制論和計算機(jī)、仿生學(xué)等新興學(xué)科的理論,將人才測評置于更前沿、更科學(xué)的領(lǐng)域;它使心理測驗回歸到被遺忘的語義闡釋的傳統(tǒng)當(dāng)中,重新審視傳統(tǒng)的測評觀點并將其在計算機(jī)上“復(fù)活”……。認(rèn)識心理學(xué)理論在人機(jī)對話測評中的應(yīng)用,拓寬了測評的視界,更新了測評的方式,是對實證主義測評范式的揚棄。所有這些,使人機(jī)對話作為一種測評方式的轉(zhuǎn)向,具備了堅實的理論基礎(chǔ)。

非智力理論。人才測評發(fā)展的新趨勢是越來越注重對非智力因素的測評。實踐智力概念的提出,就是顯例。按照斯騰伯格提出的三種類型的智力理論,人的智力有三種類型,即:①合成智力。即在一個有結(jié)構(gòu)的和定義完好的上下文中解釋信息的能力;②經(jīng)驗智力。即從不同角度看待問題、從變化的情景中解釋信息以及解決實際問題的能力;③情景智力。即適應(yīng)變化環(huán)境的能力及操縱談判系統(tǒng)的能力。 非智力理論為人機(jī)對話的運用提供的理論支持在于:一般的測評方法只能夠在簡單的文字、圖片上假設(shè)情景,局限于合成智力及經(jīng)驗智力的測評,而人機(jī)對話則使非智力因素的再現(xiàn)和測試成為可能,使得人才測評具備更廣的維度,更富層次性,更有針對性。

項目反應(yīng)理論。為實現(xiàn)最優(yōu)測評設(shè)計,項目反應(yīng)理論的做法和經(jīng)典測量理論是不同的。 它能夠事先估計好所測能力范圍內(nèi)的估計標(biāo)準(zhǔn)誤和擬編測驗的信息函數(shù),然后從題庫中選擇所測能力水平的題目。這為人機(jī)對話實現(xiàn)測評的個性化奠定了理論基礎(chǔ)。計算機(jī)替代手工自動控制測評的測驗精度,平衡題目內(nèi)容和題目類型,調(diào)整測驗篇幅,實現(xiàn)題目的自動選擇;人機(jī)對話能夠快捷地達(dá)到測評的最優(yōu)化目標(biāo):測驗篇幅最短;測驗信息函數(shù)最大;測驗離差最??;測驗時間最短;測驗信度最高;實得分?jǐn)?shù)分布與目標(biāo)分?jǐn)?shù)的分布的擬合度最好。 人機(jī)對話的許多優(yōu)點奠定在項目反應(yīng)理論之上。譬如,它能夠?qū)崿F(xiàn)計算機(jī)化的適應(yīng)性測評,隨時使得后面的測評題目的呈現(xiàn)依據(jù)前面答題的反應(yīng)情況來決定(傳統(tǒng)的適應(yīng)性測驗的做法是改變起止點,極其笨拙);它可以根據(jù)不同的測評對象確立不同的常模等等。項目反應(yīng)理論使得人機(jī)對話更具科學(xué)性和實用性。

人機(jī)交互作用理論。人機(jī)對話中的測評主體和客體能夠相互學(xué)習(xí),它很大程度上得益于人機(jī)交互作用。人機(jī)對話的一個重要特點就是利用人??機(jī)交互作用的沉浸性,根據(jù)測評客體的反應(yīng)不斷學(xué)習(xí)和選擇不同的模擬情景,有針對性地施加測試項目。仿真、實時、主動型的計算機(jī)三維動態(tài)圖像、聲音使得測試成為動態(tài)的交互作用,給予測評客體逼真的效果;測評能夠?qū)崿F(xiàn)自助,實時監(jiān)控,適應(yīng)自助式開放訓(xùn)練教室的要求,自行選擇時間進(jìn)行自助訓(xùn)練,消除測評客體的精神負(fù)擔(dān),提高測評質(zhì)量。人機(jī)交互作用理論消解了那種認(rèn)為只有直接的面對面的測評才是可靠和可信的偏見,為人機(jī)對話的合法性提供了新依據(jù)與新辯護(hù)。

人機(jī)對話所依賴的技術(shù)特點從某種程度上決定了測評的特點。不過,人機(jī)對話的特點遠(yuǎn)遠(yuǎn)超越了純粹技術(shù)的范疇。信息技術(shù)的迅速發(fā)展使得人機(jī)對話處于不斷的變化之中。測評理論和技術(shù)的進(jìn)步正朝著情景化的方向發(fā)展,有著濃厚的現(xiàn)實導(dǎo)向和實踐導(dǎo)向,力圖測評人在真實環(huán)境中的面貌。人機(jī)對話的特點,也圍繞這個方向展開。具體來說,人機(jī)對話測評方式的特點表現(xiàn)為:

(1)測評的形象性。專家人工智能裝置、模擬系統(tǒng)的運用使得人機(jī)對話測評生動、直觀,提高了人才參加測評、考核的興趣和熱情,克服了因測評主體的差異所帶來的影響。(2)測評的簡易性。人機(jī)對話測評可以提煉出最簡捷的測評項目,最大限度地涵蓋測評要素,特別是仿真模擬裝置可以將復(fù)雜的測評要素、項目經(jīng)過科學(xué)提煉、歸納,使之簡單化、科學(xué)化,更容易操作化和評價,實現(xiàn)測評設(shè)計的復(fù)雜性與測評結(jié)果的簡潔性的統(tǒng)一。(3)測評的安全性。人機(jī)對話測評的量表、測評的項目建立在大量的題庫之上,測評的數(shù)據(jù)具有層級的保密性;測評能夠加入測謊內(nèi)容,并注明測評結(jié)果的適用范圍和應(yīng)當(dāng)注意的事項;(4)測評的科學(xué)性。人機(jī)對話測評,能夠隨時檢測測評的信度和效度,確保測評數(shù)據(jù)的科學(xué)性與準(zhǔn)確性,可以排除人為因素,使測評成績真實可靠,作到公開、公正、公平,提高測評和診斷的質(zhì)量。人機(jī)對話獲得的大量數(shù)據(jù),為以后測評的不斷完善打下基礎(chǔ),使測評保持連續(xù)性。(5)測評的經(jīng)濟(jì)性。人機(jī)對話測評可以節(jié)省大量人力物力,節(jié)約培訓(xùn)時間,降低成本。(6)測評的實效性。人機(jī)對話測評能夠在人機(jī)的互動中實現(xiàn)雙方的學(xué)習(xí)。它既可以集測評與評價與一體,在測評之后能夠馬上打印測評結(jié)果;又能夠?qū)崿F(xiàn)測評與評價的分離,將測評結(jié)果交于專家進(jìn)行點評,保證測評結(jié)果的合理合法運用。

四、人機(jī)對話:應(yīng)當(dāng)注意的問題
人機(jī)對話不是萬能的。人機(jī)對話本身所依據(jù)的理論基礎(chǔ)與技術(shù)手段的不完善、人機(jī)對話測評的局限性、人機(jī)模擬與實踐的差異、人??機(jī)系統(tǒng)中人的因素依然占主導(dǎo)地位等諸多因素,決定了人機(jī)對話還存在諸多問題:

其一,信息化是一面雙面刃。首先,計算機(jī)自適應(yīng)測驗雖然使測評過程化繁為簡,化重為輕,化多為少,卻也使得越來越多的工作轉(zhuǎn)化為數(shù)字化、符號化的選擇與圈點。測評越來越變成對圖表等符號的解讀和解釋,測評的世界越來越為這些物化的數(shù)字符號所制約、消融,測評雙方的互動隱退于這些數(shù)字符號背后,所有這些很可能造成對測評主體的語言能力、思維創(chuàng)造能力乃至道德判斷與選擇力等不同程度的誤讀。此外,在自由的電子網(wǎng)絡(luò)空間中與現(xiàn)實生活中的人格的不一致,在同一電子網(wǎng)絡(luò)空間中這種人格和那種人格的不一致,這種人格的“自我同一性”在人機(jī)對話測評中可能被打破、被分裂、被扭曲的現(xiàn)實,可能引發(fā)測評中的多重人格和人格分裂現(xiàn)象,導(dǎo)致測評的紊亂。

其二,信息淹沒和排擠測評。人機(jī)對話能夠產(chǎn)生大量的數(shù)據(jù)。倘若不能對這些數(shù)據(jù)進(jìn)行嫻熟的專業(yè)處理,往往會產(chǎn)生信息迷亂。表現(xiàn)在人機(jī)對話中,就是過度的測評信息淹沒和排擠測評主體與客體,測評的手段消解了測評目的。用羅斯扎克的話說,就是:“信息,到處是信息,唯獨沒有思考的頭腦……信息太多,反而會排擠思想,使人在空洞零散的一堆事實面前眼花繚亂、六神無主、無所適從”。 這時,信息“拜物教”、電腦“拜物教”產(chǎn)生了,信息作為主體異己力量與主體對立起來。信息化測評很容易使人們過于沉溺于測評的技術(shù),忽略、回避測評雙方在生活世界的感受與交流,混淆“人機(jī)關(guān)系”和“人際關(guān)系”,混同“現(xiàn)實實踐”與“虛擬實踐”兩種不同的檢驗標(biāo)準(zhǔn),造成測評目的與手段的二律背反。

鑒于人機(jī)對話在應(yīng)用中存在一些誤區(qū),端正對人機(jī)對話的態(tài)度已成為當(dāng)務(wù)之急:

其一,要重視測評軟件本身可能表現(xiàn)出來的問題。人機(jī)對話測評離不開測驗軟件的運用。軟件的設(shè)計成熟與否決定了人機(jī)對話的成熟度。當(dāng)前很多測評軟件尤其是心理測評軟件是從西方引進(jìn)的,其理論和方法大都以西方心理學(xué)為中心。問題是,連著名的美國心理學(xué)史家g.墨菲也不得不承認(rèn):西方心理學(xué)的大多數(shù)問題只有在西方歷史??西方地理的、經(jīng)濟(jì)的、軍事的、科學(xué)的背景??的范圍內(nèi)才是有意義的問題。據(jù)統(tǒng)計,西方人才測評軟件的多達(dá)15000種之多。如果不在本土化的基礎(chǔ)上加以修訂就直接運用,往往會出現(xiàn)問題。即使是自主開發(fā)的測評軟件,也因為測試的原因,往往存在不好用、格式不統(tǒng)一等問題;至于設(shè)計思路上的問題,更會在人機(jī)對話中間接表現(xiàn)出來。據(jù)調(diào)查,現(xiàn)有各單位開發(fā)的測評軟件在即時幫助、個人答題系統(tǒng)、團(tuán)體數(shù)據(jù)處理系統(tǒng)和數(shù)據(jù)篩選系統(tǒng)等軟件易用性的條目上,大多未能完全實現(xiàn),測評報告不完善、功能模塊不完整、保密性不強(qiáng)等問題,亟待解決。

其二,要防止過分迷信測評軟件的傾向。任何測評軟件都是基于一定的理論架構(gòu)和特定的技術(shù),不可能至善至美。所謂“智者溺于所聞”,人機(jī)對話在對“傳統(tǒng)”測評方法予以超越的同時,也就埋下了局限的種子。如:忽略對面對面互動種種細(xì)節(jié)和處世態(tài)度的把握;迷信軟件的程序而忽視測評主體和客體雙方能動性的刻板思維;跨越了紙筆測驗中的“語言陷阱”卻有陷入“人機(jī)關(guān)系”陷阱的危險;網(wǎng)絡(luò)模擬的沉浸性使得測評雙方可能“夢里不知身是客,錯把他鄉(xiāng)作故鄉(xiāng)”;偏信計算機(jī)得出的測評結(jié)果,執(zhí)著于人機(jī)對話得出的數(shù)據(jù)而置測評常識于不顧……。所有這些傾向,都是值得警惕的。

其三,要防范過度的商業(yè)化取向。人機(jī)對話系統(tǒng)開發(fā)周期長、技術(shù)要求高,由于種種原因,目前人機(jī)對話的實施回報率很低,測驗制作者或修訂者得不到合理的經(jīng)濟(jì)利益,版權(quán)往往也受到很大程度上的侵害,得不到必要的法律保護(hù)。這樣,不得不過度依賴人機(jī)對話軟件及其測評來贏利,這卻會吞噬其科學(xué)性與信譽(yù),使人機(jī)對話測評急功近利,難以形成一個良好的外部環(huán)境,難以引導(dǎo)測評工作朝更廣更深的方向發(fā)展?;民R克思的話講,就是:過度的商業(yè)化傾向在給人機(jī)對話帶來過多利潤的同時,也為它蒙上了太多的恥辱。如何在人機(jī)對話的專業(yè)性、易用性、規(guī)范性及商業(yè)性方面謀求平衡,尚有待繼續(xù)深入研究。

h.艾賓浩斯的名言“心理學(xué)有一長期的過去,但只有一短期的歷史”。 倘若用來形容人機(jī)對話測評在人才測評中的運用,是同樣貼切的。人機(jī)對話為人才測評注入了新形式和新內(nèi)容,但這并不意味著一般的人才測評方法就“過時”了。恰恰是一般的人才測評方法,為人機(jī)對話的使用限定了范圍。特別是現(xiàn)階段,人機(jī)對話的應(yīng)用需要和普通測評方法結(jié)合起來,借鑒其現(xiàn)實經(jīng)驗教訓(xùn),才能夠相得益彰,共同推進(jìn)測評事業(yè)的發(fā)展。(申林 劉建洲)

標(biāo)簽閱讀: 人機(jī)對話測評:理論、方法及其問題

分享到:

相關(guān)閱讀

人機(jī)對話測評:理論、方法及其問題
人機(jī)對話測評:理論、方法及其問題
人機(jī)對話:人才測評領(lǐng)域中的新變革信息化是一場革命。它帶來人與人之間交往方式的改變和人類思維方式的轉(zhuǎn)換。因為“社會(不管其形式如何)究竟是什么呢?是人們交往的產(chǎn)物。”信息社會、網(wǎng)絡(luò)社 [詳細(xì)]
2015-11-02 17:14:48
人機(jī)對話測評:理論、方法及其問題
人機(jī)對話測評:理論、方法及其問題
人機(jī)對話:人才測評領(lǐng)域中的新變革信息化是一場革命。它帶來人與人之間交往方式的改變和人類思維方式的轉(zhuǎn)換。因為“社會(不管其形式如何)究竟是什么呢?是人們交往的產(chǎn)物?!毙畔⑸鐣?、網(wǎng)絡(luò)社 [詳細(xì)]
2015-11-02 17:14:47
  • 醫(yī)院專題
  • 醫(yī)院新聞