自拍亚洲一区欧美另类,亚洲成人影院,亚洲午夜久久久久妓女影院,最近中文字幕高清中文字幕无,亚洲熟妇av一区二区三区漫画

網(wǎng)站建設(shè) > 互聯(lián)網(wǎng)知識

查看其它板塊

HTML網(wǎng)頁中電子郵箱(Email)地址的加密和混淆防爬取

作者：Smileby陌少羽 | 2019-05-09 22:31 |點擊：

郵箱里垃圾郵件一直有很多，這讓我不得不重新審視，發(fā)布在網(wǎng)頁上的電子郵箱地址，為了避免垃圾郵件，我刻意將@更換成#，也許這在十年前是個不錯的辦法，但是隨著神經(jīng)網(wǎng)絡(luò)和機器學(xué)習(xí)新算法的發(fā)展，這一類小手段也面臨失效的風(fēng)險，因為大部分都是通過修改電子郵箱地址的“@”符號，通過正則表達式篩選和特征值匹配，比如hotmail.com、gmail.com、163.com這一類疑似電子郵箱地址的特征，還是可以抓取到電子郵箱地址，所以在將Email發(fā)布到HTML網(wǎng)頁之前我們要對其進行加密和混淆。

下面我以john@example.com為例，介紹幾種加密和混淆的反垃圾郵件手段。

1. 生成圖片

利用傳統(tǒng)的圖靈測試CAPTCHA，將防止采集的電子郵箱地址生成圖片，利用機器不能識別的特性，來區(qū)別人和機器，生成圖片的方式有很多，除了高大上的Photoshop外，甚至可以使用系統(tǒng)自帶的繪圖工具來完成，另外希望偷懶的話，還有一些在線工具可以幫助到你，比如《Top 10 Websites to Turn Your Email Address into An Image》。

當(dāng)然生成圖片也不是萬無一失的，有理由相信既然基于圖片的驗證碼能夠被機器識別破解，那么基于同樣技術(shù)的電子郵件地址肯定也再所難免，特別是OCR技術(shù)的逐步發(fā)展和成熟，采集程序可以對整張網(wǎng)頁進行OCR，最后提取需要的內(nèi)容，所以我們還需要對圖片生成的郵箱地址進行噪點、干擾線等混淆，具體可以參考有關(guān)如何防止驗證碼被識別的相關(guān)內(nèi)容。

但是經(jīng)過這么一設(shè)計，我們的郵箱地址對于真正需要的人來說則變得不那么友好，人們獲取準(zhǔn)確郵箱地址的難度也加大了。

2、替換關(guān)鍵符號

我們知道爬蟲抓取電子郵箱地址很多都是通過@這個特征符號，正如我文章一開頭所述，將這個符號替換成別的那么將大大降低我們電子郵箱被抓取的概率，當(dāng)然這樣做的壞處是除非給用戶以暗示，否則需要另外說明這是個電子郵箱地址，比如john#example.com又或者john{a}example.com等等，當(dāng)然智能的電子郵箱抓取軟件可以對這些小把戲自動免疫，通過判斷域名也可以得到這是個電子郵箱地址，所以說將@替換成一個很特別的符號也是一種生存之道，對于這種替換手段來說，更有甚者將郵箱地址變成句子，比如john AT example DOT com，這樣看來應(yīng)該更安全了，但是也給真正需要這個電子郵箱地址的用戶帶來了少許困擾。

3、使用JavaScript

JavaScript簡稱JS通常作為嵌入到網(wǎng)頁的一段小腳本，為其提供更為豐富的交互和應(yīng)用，我們通過JS混淆我們的電子郵箱地址，最后再用document.write或者innerHTML等輸出來，這樣的好處是絕大多數(shù)爬蟲并不能執(zhí)行網(wǎng)頁里的腳本，它們只擅長抓取靜態(tài)文本，所以完全不必擔(dān)心郵箱地址泄露給爬蟲，另外對于最終用戶來說，通過瀏覽器的解釋，展現(xiàn)在他們面前的全是一個完整的電子郵箱地址，用戶體驗好，不過這種方式有個較為致命的弱點就是如果用戶瀏覽器不支持腳本，那么郵箱地址也就不能正常顯示了，雖然這種情況不多見。

一個典型的例子如下，當(dāng)然有很多變形的實現(xiàn)，比如PHP hide_email我這里也不多介紹了。

var username = "john";
var hostname = "example.com";
document.write(username + "@" + hostname);

尤其值得一提的是ROT13算法的應(yīng)用，ROT13即回轉(zhuǎn)13位，說到底就是將字母表首位銜接成環(huán)，將待編碼字母映射到其旋轉(zhuǎn)的13位的字母上，如下示意圖所示：

對于PHP來說，有函數(shù)str_rot13可以直接使用，然后根據(jù)其算法反轉(zhuǎn)即可得到加密前的文本，一般使用如下JS代碼：

<script type="text/javascript">document.write("<n uers=\"znvygb:xvpx@vaprcgvba.pbz\" ery=\"absbyybj\">Fraq n zrffntr</n>".replace(/[a-zA-Z]/g, 
  function(c){return String.fromCharCode((c<="Z"?90:122)>=(c=c.charCodeAt(0)+13)?c:c-26);}));
</script>

上述代碼將解碼成以下HTML：

<a href="mailto:kick@inception.com" rel="nofollow">Send a message</a>

4、使用HTML和CSS混淆

當(dāng)然我們除了采用JavaScript，還可以利用HTML或者CSS的一些小技巧(tricks)，使用HTML注釋混淆，在HTML中以包含的是注釋，不會被瀏覽器渲染給最終用戶，那么我們可以充分利用這一點從而將我們的電子郵件地址打造成這樣的：

jo<!-- >@. -->hn@<!-- >@. -->exam<!-- >@. -->ple.com

這里不會被瀏覽器顯示，但是足以混淆機器爬蟲的抓取。

同樣的結(jié)合CSS的display:none，我們?nèi)匀豢梢缘玫揭韵骂愃剖侄蔚幕煜?/p>

jo<span style="display:none">@</span>hn@<span style="display:none">@</span>exam<span style="display:none">@</span>ple.com

同樣的CSS的display:none必然注定了其包含的文本不會被顯示，所以最終顯示的也是完整的電子郵箱地址。

對于CSS來說還有一種辦法也可以讓我們規(guī)避爬蟲抓取，那就是利用CSS文本顯示順序的特點，比如以下：

<span class="obfuscate">moc.noitpecni@kcik</span>

其中CSS代碼如下：

.obfuscate { unicode-bidi: bidi-override; direction: rtl; }

首先文本是被我們逆序的，如果要還原，在不借助JS的情況下可以通過CSS將其再次逆序，從而得到正確的文本，當(dāng)然這個方法我試用下來有一點不足，那就是用戶選擇復(fù)制電子郵箱地址仍然是逆序的。

最后總結(jié)來看，在對抗垃圾郵件爬蟲收集的方法上充分發(fā)揮了網(wǎng)友的聰明才智，也涌現(xiàn)出各種有才的實現(xiàn)，限于篇幅我也不一一介紹了，其實沒有絕對的安全，最安全的辦法就是沒有電子郵箱地址，此話怎講？那就是使用聯(lián)系表單（Contact From），讓需要和你聯(lián)系的人直接通過表單和你發(fā)郵件，從而避免了電子郵件地址的公開，網(wǎng)上聯(lián)系表單的開源代碼也有一堆，我的博客最后考慮的方式也是這個，現(xiàn)在大家可以通過右上角“關(guān)于我”找到這個鏈接并給我發(fā)消息了。

如沒特殊注明，文章均為狐靈科技原創(chuàng),轉(zhuǎn)載請注明?? "HTML網(wǎng)頁中電子郵箱(Email)地址的加密和混淆防爬取

相關(guān)推薦

返回首頁了解更多建站資訊

多一份免費策劃方案，總有益處。

請直接添加技術(shù)總監(jiān)微信聯(lián)系咨詢

立即詢問技術(shù)總監(jiān)在線 15523356218

網(wǎng)站設(shè)計品牌營銷

多一份參考，總有益處

聯(lián)系狐靈科技，免費獲得專屬《策劃方案》及報價

咨詢相關(guān)問題或預(yù)約面談，可以通過以下方式與我們聯(lián)系

業(yè)務(wù)熱線：15082661954 / 大客戶專線：15523356218

在線咨詢在線咨詢提交需求

關(guān)于狐靈科技

狐靈致力于互聯(lián)網(wǎng)品牌建設(shè)與網(wǎng)絡(luò)營銷，專業(yè)領(lǐng)域包括網(wǎng)站建設(shè)、 SEO優(yōu)化、移動互聯(lián)網(wǎng)營銷、高端網(wǎng)站建設(shè)、高端網(wǎng)站設(shè)計、品牌網(wǎng)站定制開發(fā)、營銷策劃推廣電子商務(wù)、移動互聯(lián)網(wǎng)營銷、為不同類型的客戶提供良好的互聯(lián)網(wǎng)應(yīng)用定制解決方案，我們將策略和執(zhí)行緊密結(jié)合，且不斷評估并優(yōu)化我們的方案，為客戶提供一體化全方位的互聯(lián)網(wǎng)品牌整合方案！

我們的優(yōu)勢

量身打造個性化網(wǎng)站制作

代碼深度符合SEO優(yōu)化

一站式企業(yè)網(wǎng)站建設(shè)服務(wù)

前沿視覺設(shè)計、研發(fā)能力

重慶網(wǎng)站建設(shè)公司

多項網(wǎng)站設(shè)計傳播大獎

營銷型網(wǎng)站建設(shè)專家

自主研發(fā)網(wǎng)站管理系統(tǒng)

B2C電商網(wǎng)站建設(shè)供應(yīng)商

完善的售后服務(wù)體系

我們的不同

在我們的對手消耗大量的時間停留在碎片化的互聯(lián)網(wǎng)設(shè)計或者程序?qū)崿F(xiàn)的時候，我們已經(jīng)開始把數(shù)字化品牌建設(shè)和網(wǎng)絡(luò)傳播進行了整合。我們提供從前期的網(wǎng)站品牌分析策劃、網(wǎng)站設(shè)計、創(chuàng)意表現(xiàn)、系統(tǒng)開發(fā)以及后續(xù)網(wǎng)站運營反饋建議等一系列服務(wù)，幫助企業(yè)打造創(chuàng)新的互聯(lián)網(wǎng)品牌經(jīng)營模式與有效的網(wǎng)絡(luò)營銷方法,為所有謀求長遠發(fā)展的企業(yè)品牌貢獻全力！

友情鏈接交換友情鏈接 交換友情鏈接 展開

公司地址：重慶市九龍坡楊家坪重百大樓21-8 | 業(yè)務(wù)熱線：15082661954

專業(yè)團隊為您提供重慶網(wǎng)頁設(shè)計, 品牌網(wǎng)站設(shè)計,營銷型網(wǎng)站制作,SEO優(yōu)化關(guān)鍵詞排名推廣等服務(wù),建網(wǎng)站就找狐靈科技！ | TAG標(biāo)簽 | 網(wǎng)站建設(shè)地圖 | 網(wǎng)站地圖

自拍亚洲一区欧美另类,亚洲成人影院,亚洲午夜久久久久妓女影院,最近中文字幕高清中文字幕无,亚洲熟妇av一区二区三区漫画

首頁

網(wǎng)站建設(shè)

優(yōu)化推廣

案例

方案

電商平臺

微信營銷

資訊

我們

聯(lián)系

精準(zhǔn)傳達 ? 價值共享

查看其它板塊

HTML網(wǎng)頁中電子郵箱(Email)地址的加密和混淆防爬取

熱門標(biāo)簽

多一份參考，總有益處

聯(lián)系狐靈科技，免費獲得專屬《策劃方案》及報價

業(yè)務(wù)熱線：15082661954 / 大客戶專線：15523356218

關(guān)于狐靈科技

我們的優(yōu)勢

我們的不同

友情鏈接交換友情鏈接 交換友情鏈接 展開

網(wǎng)站建設(shè)

Website Building

推廣優(yōu)化

Seo

案例

Site case

方案

Solutions

電商網(wǎng)站開發(fā)

E-commerce & System

我們

About Us

聯(lián)系

Contact Us

精準(zhǔn)傳達 ? 價值共享

查看其它板塊

HTML網(wǎng)頁中電子郵箱(Email)地址的加密和混淆防爬取

熱門標(biāo)簽

多一份參考，總有益處

聯(lián)系狐靈科技，免費獲得專屬《策劃方案》及報價

業(yè)務(wù)熱線：15082661954 / 大客戶專線：15523356218

關(guān)于狐靈科技

我們的優(yōu)勢

我們的不同

友情鏈接 交換友情鏈接 交換友情鏈接 展開

多一份參考，總有益處

聯(lián)系狐靈科技，免費獲得專屬《策劃方案》及報價

友情鏈接交換友情鏈接交換友情鏈接展開