SETI@home banner

SETI@home 螢幕保護程式 詳細解說


Data Analysis
資料分析



此部份是所有動作發生的地方。當你的電腦在做運算時,此部分會隨之做動態的更新,而其他兩個文字格子則保持不變。 當您的電腦在分析工作單位時的任何時段,畫面的這個部分都會包含了大量關於運算的資訊。 注意這個視窗有助於你了解 SETI@home 正在做啥。


螢幕保護程式現在正在做啥?

第一行顯示出這個程式現在正在做什麼,有可能顯示出許多不同種的訊息,會在下面一一解釋:

Scanning Result Header File 掃瞄"完成結果標頭"檔案

當SETI@home的螢幕保護程式啟動(或當您手動開啟)的時候,它必須要重新找出上次計算到的地方,以繼續接下去計算,它會去讀取一個存在硬碟中的檔案,以達到這個目的。

Connecting To Server 連結到伺服器

顧名思義, 程式正試著連接到SETI@home的資料庫伺服器

Receiving Data 接收資料

當您看到這個時,表非SETI@home的資料庫伺服器正在把資料送到您的電腦上,SETI@home會送出大約350kbytes實際從望遠鏡接收到的資料,及另外約1kbytes左右, 用來描述這個工作單位的一些資訊(包括此工作單位的紀錄時間、天空方位、基頻... 等),這個過程若使用28.8k的數據機,大約會花4分鐘左右的時間下載。

Doing Baseline Smoothing 基線平滑化處理

當一筆新的工作單位從柏克萊的伺服器下載回來後,其內含有許多各種不同的訊號,不過我們只對其中的窄頻訊號有興趣。 因為我們相信這些窄頻訊號才有可能被外星文明用來作為通訊用途,另一方面,寬頻訊號則大都因為一些自然的天文現象所造成的。 為了避免到這些寬頻訊號的干擾,程式本身會對資料本身做一種"平均化",並將所有其他窄頻訊號向上(或向下)移到一個共同的基線水平上(common "baseline" level)。 此外,在資料記錄的107秒中,有些訊號會慢慢地增強或減弱。基線平滑化處理也會使這些訊號調整到同一個水平上。 這是當你接到一個工作單位時,第一個執行的步驟,而通常也只會執行一次,某些SETI@home的用戶端程式(例如麥金塔電腦平台上的用戶端程式) 並不會把已經平滑處理過的資料保留起來,所以必須在每次重新啟動使用者端程式(螢幕保護程式)時得重新執行一次這個動作。在右邊的進度條圖會顯示目前這個動作執行的進度。

Computing Fast Fourier Transform 計算快速傅立葉轉換

這就是真正在做運算的步驟,從望遠鏡接收下來的資料是一連串隨著時間變動的訊號,就像是示波器上面上下起伏的聲波一樣。 在這裡,時間為水平x軸,訊號強度(空氣壓力)作為垂直y軸,這樣的原始資料事實上對我們幫助並不大, 我們是想找出是不是有強烈而且持續的"音調"藏在這些訊號中 ,因此如果能夠把頻率放在x軸,強度放在y軸的話,只要在頻率-強度圖形上看到高高的訊號,就可以知道在那個頻率有強烈的訊號了, 這樣就可以簡單的看出在這近10kHz的頻率中,哪些是有強烈訊號的。 要將以時間為基礎的原始資料轉換為以頻率為基礎的資料,必須使用一種十分複雜的數學運算,稱為快速傅立葉轉換 (Fast Fourier Transform),簡稱為FFT, 至於FFT的細節,請參考一些有關數位資料處理的書籍(digital data processing) 。

處理的結果會顯示在畫面下方的視窗中,您也許會注意到一些關於FFT的有趣事情。 從一個工作單位的起始,我們做15個不同的 FFT運算, 每一種都以不同的精確度處理資料, 一開始時,我們會找尋小至 0.07 Hz 寬度的資料。 頻率和時間是呈反比的,如果您想要非常精確的頻率,則您需要更長的觀察時間。 如果我們以0.07Hz的頻率解析度來分析資料, 我們就必須要一次觀察13.42秒的資料才行, 如此的話就得要執行8次的FFT才能完成107秒資料的處理。

如果我們以0.14Hz的頻率解析度來分析資料,就只要一次觀察6.7秒的資料,這時雖然我們的頻率解析度降到0.14Hz,可是我們的時間解析度卻提高到6.7秒, 我們必須做兩倍的FFT,才能足夠地分析此107秒的資料。(即:我們可以對107秒的資料做16次的分析)

我們會使用15種不同的頻率解析度來做FFT運算, 分別是0.075 Hz, 0.15 Hz, 0.3 Hz, 0.6 Hz, 1.2 Hz, 2.5 Hz, 5 Hz, 10 Hz, 20 Hz, 40 Hz, 75 Hz, 150 Hz, 300 Hz, 600 Hz,和 1200 Hz, 每當頻率解析度降低為原來的一半,就需要執行多一倍的FFT運算才能完成107秒的資料,所以總共要計算的FFT次數是相當驚人的!

同樣的,右邊的進度條圖會顯示目前這個動作執行的進度。你也可以在下方的頻率-時間-強度圖中,看到許多FFT運算的累積表示。

Chirping Data

我們的外星朋友們身處的星球或太空船,相對於我們的地球,不太可能是靜止的。怎麼說呢? 首先我們的地球本身就會自轉, 然後還會繞著太陽公轉的,整個的太陽系也對銀河系的中心繞。 我們有理由相信,外星文明所在的星球也跟我們類似,因此信號源與我們的地球,彼此間非常有可能有相對速度的存在(不是互相靠近就是互相遠離)。

當訊號源或接收訊號的物體間有相對速度的時候,會有一個有趣的現象發生,也就是都普勒效應,這個現象其實大家都一定有經歷過, 當一部車子想著喇叭從你身邊經過的時候,你會發現喇叭的聲調並不是固定的,當車子從遠處移動過來時,聲音不斷地在改變。 這就是因為都普勒效應的關係,影響這個效應作最重要的就是訊號源與接收者間的相對速度。

外星文明當然不會對著我們按喇叭而是對我們傳送電波(電磁波 electromagnetic waves), 電磁波與剛剛提到的聲波一樣會產生都普勒效應, 當我們與對方的兩個星系間有相對的速度時, 所產生的都普勒效應會像上述的例子一樣,扭曲了原始的訊號。 為了避免這種情況, SETI@home用戶端程式將會嘗試以許多種可能的都普勒加速值(doppler accelerations)來分析原始資料, 事實上,螢幕保護程式就是以一些數學模式,嘗試復原都普勒加速所造成的影響或稱做"chirp"。 之後才將未加速前的資料送去做FFT運算,這樣的整個步驟就稱為"De-chirping"。 SETI@home會在-50 Hz/sec到 +50 Hz/sec間嘗試許多種不同的加速值, 在以0.075 Hz為頻率解析度的情況下,SETI@home程式會嘗試以介於-5 Hz/sec到+5Hz/sec的5409 種不同數值,來檢查這筆資料!

Searching For Gaussians 找尋高斯訊號

從剛剛解釋過的 FFT ,您現在知道當頻率解析度越粗劣的,時間解析度則越纖細。 當時間解析度到了一個夠高的程度,我們可以在望遠鏡掃過天空的12秒時間內,看看訊號是否由小變大、再由大變小。 這是因為要決定一個訊號是否來自外太空而不是地球上的干擾源, 使用「高斯曲線對照」(Gaussian curve-fitting)會是一個很好的方法,因為一個從地球產生的訊號 會維持固定形態的強度,而不是隨著高斯曲線(由小變大、再由大變小)變化。 高斯曲線對照會檢測看看這個訊號是否會在12秒的時間內由小變大、再由大變小。 高斯測試的頻率解析度僅適用在大於等於0.59Hz的訊號。

由於我們找尋12秒的高斯訊號。 您所取得的107秒資料,會和它前後兩截的資料重複約15秒。 這麼做是因為我們不希望資料分割造成連接處的資料沒被計算到。

Searching For Pulses / Triplets 找尋脈衝/三連波

用戶端程式有一項新增功能可以找尋無線電訊號中的重複脈衝。 我們的"外星人鄰居"所發出的訊號也許不是用很好、很平順的音調讓我們來偵測, 他們可能傳送一系列間距或長或短的脈衝---因為這是一個比較節省功率的方法。 針對所有頻率解析度大於於等於0.59Hz的訊號,SETI@home螢幕保護程式會搜尋它的連續脈衝訊號(repeating pulses)及 三連波脈衝訊號(triplets of pulses)。


Doppler Drift Rate 都普勒漂移率

資料分析區第二行的資料包含了目前的都普勒漂移率,對這筆資料所做的第一個測試建立在假定漂移率為0 Hz/sec, 這些未加速的訊號比較有可能是從地表所發射出的無線電頻率干擾(radio frequency interference, RFI), 在漂移率介於 -10 Hz/sec 到 +10Hz/sec 之間時,SETI@home使用15種不同的頻率解析度, 每個漂移率間相差0.002 Hz/sec,而當漂移率介於 +-10 Hz/sec 到 +-50 Hz/sec 之間時, 每個漂移率間隔0.296 Hz/sec。


Frequency Resolution 頻率解析度

第二行也會顯示目前計算中的頻率解析度(frequency resolution (bandwidth)), 你會發現到大部分的時間都是以0.075 Hz的頻率解析度計算FFT, 每四個FFT,會作一次以0.14 Hz為頻率解析度的FFT, 每16個FFT,會作一次以0.29 Hz為頻率解析度的FFT...... 以此類推, 請記得共有15種不同的頻率解析度(0.075, 0.15, 0.3, 0.6, 1.2, 2.5, 5, 10, 20, 40, 75, 150, 300, 600, 和 1200 Hz) 在這其中,我們省略掉兩個最細微的頻率解析度(0.075 和 0.15) 除了在都普勒平移率大於 10 Hz/sec或小於-10 Hz/sec 時,所有這15個頻率解析度都會一一的執行。


Analysis Results 分析結果

接下來的資料分析視會窗顯示再下一個階段的結果,它會顯示目前所找到的最佳高斯(best gaussian)、最佳脈衝(best pulse)、和最佳三連波(best triplet)。 這個部分會一次顯示這上述三項中的其中一項,不過前提是當有找到該資料時才會顯示。 比方說,如果沒有強烈的三連波,那你便不會在這個視窗看到三連波。

Best Gaussian 最佳高斯

如果有一個訊號強度高於背景雜訊,並且在望遠鏡掃過的12秒內,訊號以一種類似高斯分佈曲線的方式,有漸漸變大再變小的現象,這就是我們有興趣的訊號!

強度(power)的數字代表的是這個訊號相對於基礎強度的比值。 而"fit"的數字代表的則是這個訊號的強度變化,符合高斯曲線的程度。 越低的"fit"值代表此一訊號更加的符合理想的高斯曲線。不過,當你看到了一個強烈,而且低fit值的訊號, 並不代表你就可以打電話通知媒體或昭告全世界你的新發現,任何強烈的訊號仍然必須經過驗證, 看看它是否不是肇因於無線電頻率干擾(radio-frequency-interference, RFI), 因為雜訊有可能造成類似高斯曲線。 為了避免產生太多無用的結果,SETI@home設定了一個最低門檻,如果訊號的強度在平均雜訊的3.2倍以上, 且fit值低於10,那麼這個結果才會被使用者端程式送回柏克萊大學的資料庫伺服器。

位於"power"和"fit"下方的圖形顯示了目前正在執行的曲線比對,同時也會顯示目前這個WU找到的最佳高斯曲線(Best Gaussian)。

紅色的線條是表示實際資料-特定頻率的強度隨著時間的變化, 此部分的圖形其實就是你的螢幕保護程式中最下面的圖形的一片由後到前的縱切面。當高斯曲線比對到新的頻率時,這個部分的圖會隨之改變。

白色的曲線代表目前正在處理之資料的最佳高斯曲線比對,在每段資料我們都會嘗試新的比對,所以你會看到這條曲線變化的十分的快速。

Best Pulse 最佳脈衝

為了尋找一系列連續的脈衝,SETI@home螢幕保護程式使用一種特別的測試方法, 叫作"快速倍數演算法"(fast folding algorithm), 如果這個動作找到一組連續脈衝(repeating pulses),SETI@home螢幕保護程式顯示出來,並加上一些統計資料。

"強度(power)"是表示脈衝訊號相對於雜訊的強度。 "週期(period)"是表示脈衝訊號的間距(以秒為單位),因為無線電干擾訊號(RFI) 和雜訊都和脈衝訊號很類似, 所以我們有一個最低的門檻,這個門檻是依據週期(period)和資料倍數數量的計算作動態調整, (對數學不好的人,這要牽涉到一個叫做 "incomplete gamma" 方程式的回算(inverting))。 經由脈衝訊號的振幅與這個門檻的比率可以算出一個分數(score),而當你的螢幕保護程式將結果傳回柏克萊(Berkeley)時,分數(score)大於1的脈衝訊號將會被公佈出來。

位於"power"和"period"下方的圖形會顯示在目前工作單位中的分析結果和找到的最佳脈衝。 請注意:如果沒有找到值得注意的脈衝,就不會畫出此圖

如同上述的高斯訊號,紅色的線條是表示實際資料 - 特定頻率的強度隨著時間的變化。 和高斯訊號不同的是,此圖可以不會包含全部107秒的資料,但會包含脈衝的兩個周期。 在圖中,你可以看到兩個突波從雜訊中升起。圖中左右兩邊是一模一樣的,即為兩個周期,顯示兩個周期也能幫助您了解這個脈衝的完整波型。

更多關於 SETI@home 資料分析的技術資訊,請參見SETI@home 天空探測論文。

Best Triplet 最佳三連波

SETI@home 程式會針對脈衝多做一項分析。此分析項目會找尋三個等距離的的脈衝。 螢幕保護程式會找一對高於特定強度的脈衝,然後在這兩個脈衝之間找尋剛好準確地介於兩者之間的另一個脈衝。 假若找到的話,它會被記錄下來,並傳送回柏克萊。

倘若三連波被找到的話,有一行文字會顯示出來,並列出脈衝的強度power(此數值是和雜訊基線(noise baseline)的對比值)、 以及用秒數標示脈衝之間的時間(周期 period)。

位於"power"和"period"下方的圖形會顯示在目前工作單位中所找到的最佳三連波。 三個脈衝會用黃色的標記標示起來。 請注意:如果沒有找到值得注意的脈衝,就不會畫出此圖


回到 Sreensaver 首頁


    本頁譯者為:謝志逸; 校稿:SFK
如欲轉載請來信告知,謝謝。
setitaiwan@yahoo.com
本頁原文網址: http://setiathome.ssl.berkeley.edu/screensaver/data_analysis.html