TinyMCE是Joomla自1.5至3.x的标准文本编辑器。它有你需要写内容(文本和图像),并发布您的博客的基本功能。事实上,文本编辑器在Joomla中是最重要的组件组之一。 TinyMCE编辑器就像是一个简化及有限功能的文件处理器。
不过,我很习惯用第三方文本编辑器,JCE - Joomla Content Editor,比起TinyMCE它是个更好的文本编辑器。我所有的网站都使用JCE。此外,JCE是免费的,你应该试一试。
当您创建新文章时,这是您在TinyMCE中看到的;
这是PHP网络蜘蛛提取Email地址脚本最后一章, 我将展示如何把收集到的资料储存在MySQL数据库。您可以把从多个网站收集到的资料储存在同一个数据库。
您也可以把资料分类。比如说您从产业网站及购物网站收集的资料分开储存在不同的数据库表。
首先在您的电脑运行XAMPP,并确保激活Apache及MySQL。在浏览器输入URL "http://localhost/phpmyadmin/"。在顶部菜单栏选择"Database"。在这教程里我们的数据库为"email_collection"。 按"Create"钮可看到如下 图般。
您可在此下戴PHP cURL邮址提取脚本。
在这文章里,我将展示如何进一步修改我们的电子邮址提取脚本,注入爬行能力,并收集尽可能最多的电子邮址。
诀窍很简单 - 我们不要爬行整个网站并检查每个网页。这样做会消耗大量的带宽和时间。我们只需要抓取网页有针对性的电子邮件列表,因此,只要我们知道总页数,然后循环从第一页到最后一页就可完成任务了!
首先,检查目标网站的分页。在这个例子中,它有页面1,2,3,...和“Last”页面按钮。按下此钮将带我们到最后一页,第169页。每个页面有10个电子邮件地址,所以从这个网站可以得到将近1690电子邮址。页面总数(目前为169)将来是可以改变的。如果我们想重用我们的电子邮件提取脚本,它必须能够自动检测总页数。
在本文里,我将解释如何使用PHP/cURL从网页提取Email地址。PHP脚本将运用正则表达式匹配HTML标签提取。
想想看,如果我们寄出电邮开头以“先生您好”或“老板您好”,那收信者多数会把我们的邮件当成垃圾处理。所以使用网络爬虫或蜘蛛采集Email地址时,我们也需提取相关的资料如姓名,电话号码,公司名称,职位等。把这些资料包括在邮件内容,收信者就会仔细阅读。
当然,请您不要滥用海量采集电子邮件地址的能力,胡乱发出垃圾邮件,令人反感的广告内容,违反版权法或干扰网络带宽。如果您惹祸上身,小弟没有势力救不了您,还是请个律师帮忙好。
如果您要开发新网站,其实您不必马上注册域名及购买网站托管计划。因为
1) 您可能在开发半途想要改变计畫,而那域名可能和您新内容不符。
2) 您可以在完成网站开发及写上足够的内容才放在网上,看起来就不会那麽空洞。
3) 您可以在不必上网的情形下向客户展示正在开发中的网站。
如果您已安装XAMPP(没有的话,请看这里如何安装),那您就可轻而易举的在本地(Windows电脑)安置Joomla,开发后才上传网络。我在这里使用Joomla 3.1.5为例子,万变不离其宗,您其实可用同样方法安装PHP/MySQL的程序如Wordpress, Drupal等等。请记得打开电脑的XAMPP。
直接去Joomla的网站下戴最新的开源内容管理系统。按"Download"。写这篇文章时是Joomla 3.1.5。
当您成功装置XAMPP之后,我们就可以在PHP/MySQL环境生成PHP脚本索取网页源文件。PHP有很多函数库帮我们向伺服器发送请求及接收伺服器送回的文件,其中一个是我们将要用到的cURL。
现在我们先写一个间单的PHP/cURL类来协助我们向伺服器提出请求,之后我们才能向网页源文件“开刀”取出我们要的资料。我们也不时要改进我们的程序源码。
首先,在C:\xampp\htdocs下创建一个文件夹“scraper”,然后使用Notepad++在文件夹C:\xampp\htdocs\scraper创建一个文件httpcurl.php。