多語言網(wǎng)站是指所提供的內(nèi)容含有兩種以上語言的網(wǎng)站。多語言網(wǎng)站的例子包括:加拿大公司的網(wǎng)站有英文及法文版本,或是有關拉丁美洲足球的資訊同時提供西班牙文和葡萄牙文版本。
多地區(qū)網(wǎng)站是指明確鎖定不同國家/地區(qū)使用者的網(wǎng)站。某些網(wǎng)站既是多地區(qū)網(wǎng)站,也是多語言網(wǎng)站(舉例來說,一個網(wǎng)站可能會有美國和加拿大地區(qū)兩種版本,而加拿大地區(qū)的內(nèi)容又同時含有法文和英文版本)。
管理網(wǎng)站的多重地區(qū)版本
以下是一些提示,可供您確認本地化的內(nèi)容是否出現(xiàn)在適當語言的搜尋結果中。
確認網(wǎng)頁的語言相當明確
Google只會使用網(wǎng)頁上顯示的內(nèi)容來判斷網(wǎng)站語言。并不會使用任何語言代碼,例如lang屬性。您可以針對每個網(wǎng)頁的內(nèi)容和瀏覽項目使用單一語言,并避免將翻譯內(nèi)容與原文并排顯示,以協(xié)助Google正確地判斷網(wǎng)頁語言。如果以單一語言保留大部分內(nèi)容的同時,只翻譯網(wǎng)頁上的重復性文字(通常發(fā)生這種情況的頁面都含有使用者產(chǎn)生的內(nèi)容),則含有各種重復性語言的搜尋結果中,如果多次出現(xiàn)相同的內(nèi)容,就可能會留給使用者不好的印象。
使用robots.txt可以防止搜尋引擎檢索網(wǎng)站上自動翻譯的網(wǎng)頁。自動翻譯有時詞不達義,可能會被視為垃圾內(nèi)容。更重要的是,劣譯或呆板不順口的翻譯,可能讓網(wǎng)站的瀏覽者反感。
確認各個語言版本都能很容易找到
將各個語言的內(nèi)容存放在不同的網(wǎng)址中。請不要使用Cookie 來顯示網(wǎng)頁的翻譯版本??紤]讓各種語言版本的網(wǎng)頁都能相互連結。這樣一來,瀏覽德文版網(wǎng)頁的法文使用者只需按一下連結就能連往適合他的語言版本。
避免自動判斷使用者所用語言并重新導引到該語言版本。這些重新導向動作可能會讓使用者(以及搜尋引擎) 無法檢視您網(wǎng)站的所有版本。
謹慎選擇網(wǎng)址
Google是根據(jù)網(wǎng)頁的內(nèi)容來判斷其語言,但是網(wǎng)址本身也能夠讓使用者判斷網(wǎng)頁內(nèi)容。例如,下列.ca網(wǎng)址的子網(wǎng)域或子目錄使用fr來表示其內(nèi)容為法文:http://ccxcn.ca/fr/vélo-de-montagne.html和http://fr.ccxcn.ca/vélo-de-montagne.html.
在網(wǎng)址中注明語言也能夠幫助您找出網(wǎng)站中多語言內(nèi)容的問題。
您可以翻譯網(wǎng)址中的文字,也可以使用國際化網(wǎng)域名稱(IDN)。請務必在網(wǎng)址中使用UTF-8編碼(事實上,我們建議盡量都使用UTF-8),并記得讓這些在連往這些網(wǎng)址時,以正確的逸出字元作為網(wǎng)址。
將網(wǎng)站內(nèi)容鎖定為針對特定國家/地區(qū)
如果Google 察覺到某個網(wǎng)站的目標國家/地區(qū),就能夠利用此資訊來改善不同國家/地區(qū)的搜尋結果品質(zhì)。Google 通常會使用下列元素來判斷網(wǎng)站鎖定的目標國家/地區(qū):
國家代碼頂層網(wǎng)域名稱?(ccTLDs)。這些名稱受限于特定國家/地區(qū)(例如,.de表示德國、.cn表示中國),因此對使用者和搜尋引擎兩者來說,是表示網(wǎng)站明確鎖定特定國家/地區(qū)的顯著指標(有些國家/地區(qū)對于ccTLD的使用者有所限制,所以請務必先了解詳情)。我們也會將較少人使用的ccTLD (例如.tv、.me、etc.)視為gTLD,因為我們發(fā)現(xiàn)相較于以國家為目標的代碼,使用者和網(wǎng)站管理員經(jīng)常認為這些代碼更加普通(我們沒有完整的清單可記錄我們視為gTLD的ccTLD,因為這份清單會隨時改變)。查看Google的一般網(wǎng)域完整清單。
地理定位設定。您可以使用網(wǎng)站管理員工具中的指定國家/地區(qū)工具,向Google指定網(wǎng)站鎖定的目標國家/地區(qū)。您的網(wǎng)站必須要有一般頂層網(wǎng)域名稱,才能這么做。但是,如果您的網(wǎng)站鎖定了多個國家/地區(qū),則請勿使用這項工具。例如,將介紹蒙特婁當?shù)夭蛷d的網(wǎng)站設定以加拿大使用者為目標就很有道理,但是將那些著重于法國、加拿大和馬利等法語使用者的網(wǎng)站,設定以加拿大使用者為目標,就不太合理。
注意:因為地區(qū)性頂層網(wǎng)域(例如.eu 或.asia) 并非指定單一國家/地區(qū),所以Google 會將其視為一般頂層網(wǎng)域。
伺服器位置(透過伺服器的IP位址判定)。伺服器位置通常鄰近您的使用者所在地區(qū),也可能透露網(wǎng)站的目標群眾所在。某些網(wǎng)站會使用分散式內(nèi)容傳送網(wǎng)路(CDN),或是將主機架設于網(wǎng)路伺服器基礎架構較佳的國家/地區(qū),此時的位置就不具指標意義。
其他指標。其他有關您網(wǎng)站目標群眾的線索來源還包括網(wǎng)頁上的當?shù)刈≈泛碗娫捥柎a、是否使用當?shù)卣Z言和貨幣、來自其他當?shù)鼐W(wǎng)站的連結和/或是否使用Google我的商家?(如果有)。
Google不會使用位置中繼標記(例如geo.position或distribution)或HTML屬性來進行地理定位。
網(wǎng)址結構
考慮使用網(wǎng)址結構,這可以讓您將網(wǎng)站內(nèi)容依照不同地理區(qū)域加以劃分。請參考以下表格,以便了解您可以選擇的方法有哪些:
網(wǎng)址結構 | 范例 | 好處 | 壞處 |
特定國家/地區(qū) | ccxcn.ie |
|
|
有gTLDS 的子網(wǎng)域 | de.ccxcn.com |
|
|
有gTLD 的子目錄 | ccxcn.com/de/ |
|
|
網(wǎng)址參數(shù) | site.com?loc=de |
|
|
地理定位并非100% 準確,所以您必須設想,當使用者瀏覽到錯誤的網(wǎng)站版本時,您應該怎么做。在所有網(wǎng)頁上顯示連結,讓使用者能夠自行選擇地區(qū)和/或語言,便是一種可行的作法。
重復的內(nèi)容和國際網(wǎng)站
有時候,這類針對不同地區(qū)提供特定內(nèi)容的網(wǎng)站,如果又同時提供了多種語言版本,便可能會在不同的網(wǎng)址上放置相同或類似的內(nèi)容。只要該內(nèi)容是針對不同國家/地區(qū)的使用者,通常就不成問題。雖然我們強烈建議針對各種不同族群的使用者提供不同的內(nèi)容,但是要做到這一點并不容易。一般來說,在robots.txt檔案中禁止檢索,或是使用"noindex"漫游器中繼標記,就不需要「隱藏」重復的內(nèi)容。但是,如果您在不同網(wǎng)址上提供同樣的內(nèi)容給相同使用者(例如,如果ccxcn.de/和ccxcn.com/de/同時顯示了給德國使用者的德文內(nèi)容),就應該選一個偏好的版本,并適當?shù)剡M行重新導向?(或使用rel=canonical連結元素)。此外,建議您按照rel-alternate-hreflang指南,確認您已向搜尋資訊的使用者提供正確的語言或區(qū)域網(wǎng)址。
針對多語言網(wǎng)站,NC會采用同一網(wǎng)域、子資料夾、各別資料庫方式,或是不同網(wǎng)域、上層資料夾、各別資料庫。
當采用不同網(wǎng)域規(guī)格時,我們可以提供美國HE主機、香港IBM主機、臺灣HINET主機、北京主機(需要搭配.cn網(wǎng)域跟主機備案)、英國主機。