作者 chordate (にんきもの)
標題 Re: [討論] 民調統計之亂---最終章
時間 Wed Nov 22 03:12:15 2023


:
: 小弟看到版上很多人對民調統計很有興趣,
: 剛好這幾天我有一點粗淺的研究成果, 提出來和大家分享一下.
: 如果有錯還請不要見怪.
:
: 先講結論:
:
: 1. 如果沒有每一份民調原始數據, 無從判斷是3:3或是5:1,
: 2. 如果在某一份民調中, 柯侯和侯柯的正相關性r高達0.8,
:    (這個r值每份民調都不一樣)
:    那麼民調之中柯侯只要領先侯柯2%,
:    統計上就代表柯侯顯著勝過侯柯
:
: 3. 如果r接近1, 那誤差範圍=0.001%, 柯侯與侯柯誰多贏一票就是贏了 ,
:    所以民眾黨用原始數據稱六份民調當中他們贏五份, 並非全無道理.
:

如果看版上說民眾黨的算法的話,
他們是應該是先算 柯侯-賴蕭1 和 侯柯-賴蕭2
這裡會先誤差放大約2倍(就是林教授的文章中的公式)

https://blog.udn.com/nilnimest/24057891

(附帶一提,上面的公式推導可以用二項分布的variance,
以及Var[X-Y]= 2Var[X]+2Var[Y]-Var[X+Y]得出)

然後再算 (柯候-賴蕭1)-(侯柯-賴蕭2)
這個時候兩個括號內的變數的相關係數會起作用。

假說檢定時,
如果不知道相關情況的話,就用常態分布或是Student-t test可以將就一下

其實這兩個數據本來是paired的(因為是問同一組人)
誤差範圍可以做到更小。不過不知道為什麼都不公布原始數據就是了。

推文裡面有提到加權的問題,
確實加權就會讓誤差先放大了,
不過看一般公布的民調似乎也都沒有在考慮加權的。

--
※ 文章代碼(AID): #1bNG4IP4 (HatePolitics)
※ 文章網址: https://www.ptt.cc/bbs/HatePolitics/M.1700593938.A.644.html
※ 同主題文章:
Re: [討論] 民調統計之亂---最終章
11-22 03:12 chordate
※ 編輯: chordate (146.70.205.188 日本), 11/22/2023 03:18:14
henryliao: 主要是民眾黨的3份民調加權到超過常理1F 114.42.67.55 台灣 11/22 03:20

有權重數字的話就可以算算放大多少

variance會放大  權重平方和/權重和的平方 倍

Supasizeit: 市話年齡層加權有誤差、手機門號太多也有誤差、這些誤差,都是柯主席答應退讓的部分,所以請不要當民族罪人2F 203.204.194.135 台灣 11/22 03:23
※ 編輯: chordate (146.70.205.188 日本), 11/22/2023 03:26:48
forb9823018: 因為那些民調公司不是專門為他們服務,有些是拿現有公布民調直接拿來
而且公布加權方式,就像餐廳把食譜配方公布出來,還是免費公布5F 111.248.132.129 台灣 11/22 03:35
kh749: 他們一樣假設r=0.9, 就會算出來黃珊珊記者會上說的1.34%2=2.68%, 讓3%已經太多的結論可是每份資料的r不一樣, 像聯合報的r=010F 36.224.243.40 台灣 11/22 03:42

--
作者 chordate 的最新發文:
點此顯示更多發文記錄