當前位置：東奧會計在線 > 中級經(jīng)濟師 > 人力資源 > 正文

甄選的可靠性與有效性_25年中級經(jīng)濟師人力資源基礎(chǔ)知識點

來源：東奧會計在線責編：孟凡瑩2025-04-14 16:07:33

北京

輔導(dǎo)課程

別用平凡定義自己，你努力向上的樣子，本身就是耀眼的光。想必備考中級經(jīng)濟師的同學(xué)們心中都在憧憬著考后的未來，那么在復(fù)習的過程中我們就不要懈怠，幸運和努力是需要成正比的，夯實基礎(chǔ)對于新手考生來說是很重要的，下面為考生們準備25年中級經(jīng)濟師人力專業(yè)的基礎(chǔ)知識點，一起學(xué)起來吧。

甄選的可靠性與有效性_25年中級經(jīng)濟師人力資源基礎(chǔ)知識點

【內(nèi)容導(dǎo)航】

甄選的可靠性與有效性

【內(nèi)容導(dǎo)航】

第六章　人員甄選

【知識點】

甄選的可靠性與有效性

只有當一種甄選工具達到可靠和有效的時候，才有可能是合格的。

任何一種甄選方法都應(yīng)當達到一定的信度和效度，信度是效度的必要條件(但不是充分條件)。

一項甄選測試的：

①信度如果不好，其效度一定較差。

②效度較好，其信度也一定比較高。

(一)信度

定義：一種測試手段不受隨機誤差干擾的程度，它反映了一個人在反復(fù)接受同一種測試或等值形式的測試時所得到的分數(shù)的一致性程度。又稱為內(nèi)部一致性程度或穩(wěn)定程度，它是對任何一種測試工具的最基本要求。

信度的高低是用信度系數(shù)來表述的，信度系數(shù)介于0～1之間，0最低，1最高。一般情況下，信度系數(shù)不低于0.7的測試工具被視為信度較好。

最常用的信度測試方式：重測信度、復(fù)本信度、內(nèi)部一致性信度和評價者信度?！颈貢?/p>

1.重測信度

定義：又稱再測信度，是指用同一種測試工具在不同的時間對同一群人進行多次測試所得到的結(jié)果的一致性程度。

它可以用來考查一種測試工具在時間上的穩(wěn)定性，具體信度系數(shù)用多次測試所得的結(jié)果之間的相關(guān)系數(shù)來表示。

注意：兩次測試的時間間隔不能太短，也不能太長。兩次測試的時間間隔為半個月到半年可能比較合適。

2.復(fù)本信度

復(fù)本是指在測試的結(jié)構(gòu)、實際測試效果等方面與最初的測試工具基本保持一致的一種測試工具。(A、B卷)

定義：對同一組被測試者進行某種測試時，使用兩種功能等值但是表面內(nèi)容并不相同的測試形式，然后考查這兩種等值的測試中被測試者取得的分數(shù)的相關(guān)程度。

復(fù)本信度的高低反映了兩種復(fù)本測試在內(nèi)容上的等值程度。

3.內(nèi)部一致性信度

定義：反映同一測試內(nèi)容的各個題目之間的得分一致性程度。它考查了同一項測試中的若干題目是否確實都是在測量同一個內(nèi)容或特質(zhì)。

一種很好的測試工具必須具有很好的內(nèi)部一致性。

考查內(nèi)部一致性信度的方式：分半信度和同質(zhì)性信度。

①分半信度：將一個測試中包含的題目一分為二，然后考查這兩個半份測試結(jié)果之間的相關(guān)系數(shù)。最常見的分半方法是根據(jù)題目排列的奇偶數(shù)順序來劃分，即一半是奇數(shù)題，一半是偶數(shù)題。

②同質(zhì)性信度：一種測試內(nèi)部的所有題目考查同一內(nèi)容的程度。在同質(zhì)性信度低時，即使各個測試題目看起來測量的是同一特質(zhì)，但測驗實際上是異質(zhì)的，即這種測試實際上測量了不止一種特質(zhì)。表示同質(zhì)性信度的一個常用參數(shù)是克倫巴赫α系數(shù)。

4.評價者信度

定義：不同評價者在使用同一種測試工具時所給出的分數(shù)之間的一致性程度。

不同的觀察者、研究者或評價者對于被測試者表現(xiàn)出的同樣的行為或者問題的回答可能會得出不一樣的判斷和評價，評價者本身的閱歷、看問題的視角甚至個人偏好都會影響他們的評價結(jié)果。這種情況在情景模擬測試、投射測驗、面試、無領(lǐng)導(dǎo)小組討論等需要由專家或評價者來打分的時候，都有可能出現(xiàn)。在對員工進行績效考核時，也可能會出現(xiàn)不同的評價者給出不同的評價結(jié)果的現(xiàn)象。

【總結(jié)】

重測信度-時間不同;

復(fù)本信度-內(nèi)容不同;

內(nèi)部一致性信度-題目不同;

評價者信度-評價者不同。

要想達到較高的信度，需要注意的問題：

①測試過程要標準化，盡可能按照測量學(xué)的要求去做;

②選取的樣本要具有廣泛的代表性，當在總體中抽樣時，樣本應(yīng)盡可能具有異質(zhì)性，而不是集中于某一類人;

③要注意保持良好的測試環(huán)境(包括心理環(huán)境和物理環(huán)境)，努力使被測試者保持一種輕松自然的心態(tài);

④要注意測試的難度和長度，測試太難或太易都不好，因為很可能會出現(xiàn)地板效應(yīng)(得分普遍過低)或天花板效應(yīng)(得分普遍偏高)的現(xiàn)象;

⑤盡管測試的條目越多，信度往往越高，但是太多的條目容易引起被測試者的疲勞和厭倦，從而影響測試的質(zhì)量。

(二)效度

一種甄選測試工具要想有用，只具有可重復(fù)性或穩(wěn)定性(即信度較高)是遠遠不夠的。如果一項測試盡管結(jié)果總是很穩(wěn)定，但是與事實并不相符，這種測試也是沒有意義的，測試所產(chǎn)生的結(jié)果應(yīng)該具有較好的效度。

定義：一種測試的有效性程度，它反映了測試工具對于它所要測量的內(nèi)容或特質(zhì)進行準確測量的程度。

效度主要分為：內(nèi)容效度、效標效度和構(gòu)想效度?！颈貢?/p>

1.內(nèi)容效度

定義：一項測試的內(nèi)容與測試所要達到的目標之間的相關(guān)程度，即一項測試的內(nèi)容能夠代表它所要測量的主題或特質(zhì)的程度。

一項測試具有較好的內(nèi)容效度，必須滿足的條件：

①確定想要測試的內(nèi)容的范圍，并且使測試中的全部項目均在此范圍之內(nèi);

②測試中的項目應(yīng)當是已經(jīng)界定好的內(nèi)容范圍中具有代表性的樣本。

內(nèi)容效度的檢驗主要采用專家判斷法，不太適合對智力、領(lǐng)導(dǎo)能力以及誠實性等較為抽象的特質(zhì)進行評價?！颈貢?/p>

局限性：

①隱藏在內(nèi)容效度背后的一個基本假設(shè)是：求職者在被雇用的時候已經(jīng)具備了一定的知識、技術(shù)或能力。如果一個組織準備在甄選和雇用求職者之后，再通過正式培訓(xùn)計劃來教會他們掌握工作所必需的技能，內(nèi)容效度就不太適合。

②內(nèi)容效度中主觀判斷的作用很大，因而必須設(shè)法將判斷過程中的推測成分減至最少，最好是將評價者的評分建立在某種相對具體和可觀察的行為的基礎(chǔ)之上。

2.效標效度

定義：也稱效標關(guān)聯(lián)效度，是指一種測試或甄選技術(shù)對被試者的一種或多種工作行為或工作績效進行預(yù)測的準確程度。

在人員甄選中，組織最關(guān)注的問題實際上是通過某種測試或評價技術(shù)所得到的結(jié)果是否能夠準確地預(yù)測出求職者在未來的工作中取得成功或招致失敗的程度。

判斷方法：判別通過甄選測試所得到的分數(shù)與實際工作績效得分之間是否存在實證性聯(lián)系。如果在測試分數(shù)和實際工作績效分數(shù)之間存在明顯的相關(guān)關(guān)系，便可以證明這種測試具有較好的效標效度。

常用的效標效度：

①預(yù)測效度：所要考查的是員工被雇用之前的測試分數(shù)與其被雇用之后的實際工作績效之間是否存在實證性聯(lián)系。

確定預(yù)測效度的基本方法：在雇用求職者之前首先對求職者進行某種測試，然后將他們中的一部分人雇用到組織中，等他們進入組織一段時間之后，再測試這些人的實際工作績效情況，最后看這些人在被雇用前后的這兩組數(shù)據(jù)(即甄選過程中參加測試時的分數(shù)以及后來的績效分數(shù))之間的關(guān)聯(lián)性。如果兩者之間的相關(guān)系數(shù)較高，則稱這種測試具有較好的預(yù)測效度，即在這種測試中得分較高的人在未來的實際工作中往往也是績效較好的人，這就意味著利用這種測試工具對求職者進行篩選是有效的。

預(yù)測效度存在明顯的問題：組織必須等待很長的時間，才能得到考查效標效度所需要的數(shù)據(jù)。

組織首先要有足夠的時間來雇用大量的求職者，并獲得他們在相關(guān)測試中的得分，然后還要再等待一段時間才能開始收集被雇用的求職者的實際工作績效信息。在某些工作中，為了確定誰是優(yōu)秀的員工或確定員工的績效水平，可能要花費很長的時間。

②同時效度：在確定一種測試工具的同時效度時，需要在同一時間獲取兩組數(shù)據(jù)(參加測試時的分數(shù)以及績效分數(shù))。

主要做法：直接選取那些已經(jīng)在某種崗位上從事工作的任職者，讓他們完成某種測試，得到測試分數(shù)，由于他們已經(jīng)在崗位上，所以比較容易得到他們的績效數(shù)據(jù)，考查這兩組數(shù)據(jù)之間到底存在怎樣的相關(guān)關(guān)系。

如果兩組數(shù)據(jù)之間的相關(guān)度很高，即在這些已經(jīng)在崗的員工中，工作績效最好的人比工作績效較差的人在甄選測試中所得到的分數(shù)更高，則稱這種測試工具具有較好的同時效度。

3.構(gòu)想效度

定義：也稱結(jié)構(gòu)效度，是指一項測試對于某種不可觀察的、比較抽象的構(gòu)想或特質(zhì)進行測量的程度。即一項測試的結(jié)果是否能夠證實或解釋某一理論上的假設(shè)、術(shù)語或構(gòu)想的程度。

影響因素：

①理論上的構(gòu)想代表性不足;

②構(gòu)想代表性過寬，以至于包括了無關(guān)事物。

構(gòu)想效度是一個存在爭議的概念。因為有些構(gòu)想概念非常模糊，缺乏一致性的定義，確定構(gòu)想效度時也沒有明確的操作步驟，沒有單一的數(shù)量指標能夠描述其有效程度。

本文中級經(jīng)濟師考試知識點內(nèi)容由東奧教務(wù)團隊整理