View
231
Download
10
Embed Size (px)
Citation preview
蔡佳泓政大選舉研究中心
—世新大學行管二甲 2010/3/12
1
測量法
測量
測量 (measurement)是按照一定規則,將數字指定到某個研究對象。
測量的概念與被測量的對象必須有一致的結構,稱為結構一致性。例如,有一組觀念,被稱為 {A,B,C} ,有一組數字 {1,2,3} 。
{A,B,C}的結構是一種編號,而 {1,2,3}的結構是連續數字,兩者不一致。若一組數字為 1, 2,3,..,10}而一個敘述為 {x為 1 到 10
的分數 } ,那麼兩者有一致性。
指標
根據操作型定義,測量概念的某一面向,得到一個指標。
例如民主的面向之一是政黨公平競爭,操作型定義是每個政黨的選舉經費差別越大,競爭越不公平,因此,測量競選經費的數目,再去求出其變異數,便得到一個民主的指標。
指標的例子
績效的概念是完成組織指定的工作,操作型定義是在一定時間內,個人為組織創造的利潤,所以指標便是營業額扣掉各種成本之後的利潤。
但是這樣的操作型定義可能忽略掉個人的成長、人際關係等更長期的發展,這樣的指標也就著重短期的利潤而非更全面的部份。
測量的層次
名目順序等距比率
名目尺度
名目尺度的內涵是標示分析對象的種類 。 分類必須互斥例子:性別(男或女或?)、職業(經理、教師、農民等)、省籍(閩南、客家、大陸各省市、越南?)、宗教(佛教、民間信仰、伊斯蘭教… . )、居住地 …
順序尺度
順序尺度提供的資訊是由高而低的排序,顯示研究對象的特質為高、中、低,強或弱、冷或熱等程度 。
例:教育程度、社會階層等
中位數為集中趨勢
等距尺度
等距尺度假定每個刻度之間的距離相等,所以可以做各種數學運算。
例:投票率、智力、收入等
等比尺度
等比尺度在自然科學中較常見,只是比等距尺度多了絕對的零。
重量、長度、時間、面積等
信度效度
一個好的問項所引出來的答案,要能夠可靠又有效地測量我們所要描述的現象。在測量的意義上:「信度」是用來衡量答案的一致程度:當我們所要描述的狀態一致的時候,答案也是一致的。而「效度」是用在評量我們所得到的真實價值,彼此契合到什麼地步。
信度
測量到的結果不管任何時間都一致, 不會有誤差。
測量誤差可用 E=X-T表示, X 是觀察到的特質, T是真實特質。
信度高的測量, 才有信心用來預測未來。
信度的例子
儀器的信度:視力、 聽力、 體重、心跳速度等。 測驗的信度:考試、 智力測驗。 問卷的信度:受訪者的回答, 包括態度、 行為、 事實等等。
信度的原理
從測量誤差的公式可得 X=E+T。
從變異量的公式可得 Sx2= ST
2 +SE2
而真實特質的變異量佔觀察特質的變異量比率 ST2 /
Sx2稱為信度, 通常以 rho表示。
信度的估計
以上的公式有兩個未知數 E 、 T , 只有一個已知數 X 。
假設 X’是平行測驗所得的值, 統計學家發現, X
跟 X’的相關係數 = ST2 / Sx
2,剛好就是 rhox 。
平行測驗圖示
E11誤 差
X 11觀 察 值
E22誤 差
X 22觀 察 值
T真 實 分 數
平行測驗原理
同一團體但不同時間所得的分數不同團體但同一時間所得的分數所得的分數或回答做相關分析得到的相關係數,可以代表真實分數所佔的比率,即信度。 最高為 1 。
相關係數 :Σ(x-x_bar)(y-y_bar)/sqrt(Σ(x-x_bar) 2) sqrt(Σ(y-y_bar)2)
折半信度 (1)
將一份問卷或測驗分為兩部份計算全部問卷或測驗的信度 (Spearman-Brown): 2rhoxx’/1+ rhoxx’
假設折半的相關係數為 0.75, 那麼全部的信度為2*.75/1+.75=.857
折半信度 (2)
假設有類似的題目加入原來的量表,則可用以下公式計算信度 n*rhoxx’/1+(n-1) rhoxx’ n 是題目加長或減短倍數
比方說有一個 10題的量表, 拆成 5 題 5 題, 計算其信度得到 0.2,如果再設計一個有 20題的量表, 那麼跟這個量表平行的量表的信度將是4*0.2/1+(4-1)*0.2=0.5
內在信度
測量幾道題目之間是否具有一個單一尺度的結構Cronbach’s alpha: N*(mean of rho)/1+ (N-1)*(mean of
rho)題目越多, 在題目之間相關性 rho 相同的情況下,
alpha 越大至少要 0.5
效度
測量能夠測到真正的特質, 即效度。 X=T+E 。 E 若一直為 0 就是有效度。 E 若是不為0 但是為一固定常數, 就是有信度。所以信度可以說是效度的必要條件。
有信度不一定有效度, 有效度則一定有信度。
效度的例子
溫度計 --- 可以用來測溫度,但是不會有人拿來測溼度。
倍數高的望遠鏡可以幫我們測量行星之間的距離。 用 X 光或超音波測量骨密度。 用巴式量表測量身體功能用 GRE 測量留學生的智力
效度
表面效度 (face validity)內容效度 (content validity)預測效度 (predictive validity)建構效度 (construct validity)
表面效度
就測量的表面來決定是否有效度。 例如: 用尺測量身高腰圍等, 用水測量大象的重量,
用 IQ 量表測量人的智商等。
內容效度
單獨的測量可能具有表面效度,而多重測量可能具有內容效度,例如測量對於人性的看法,可能問好幾個問題 (多數人可以信任、多數人的看法是對的、人與人之間常會有衝突等 )
預測或實用效度
用另一個獨立且有效的測量來評估測量的效度。 以實證方法評估例如: 學生托福成績應該與其在國外語言表達能力有
關; 國外語言表達能力的測量有無效度可以用托福成績來確定。
建構效度
與預測效度類似, 但是更注重測量與測量之間的理論關係。
例如: 人格特質與行為有關; 家庭教育又與人格特質有關; 家庭社會地位可能與家庭教育有關等等。
檢驗建構:效度相關研究 ,因素分析,實驗研究等
內在與外在效度
內在效度指在特定研究中測量是否適當?例如研究政黨,所有的政黨是否符合同樣的定義 (參與選舉提名候選人等 ) ,並且它們不同於社會運動或利益團體等。
外在效度指不同研究可應用同一測量,即不因時間與地點而改變