首页 技术教程 实用代码 注册破解 正则表达式 网址导航 电子书籍

利用Yahoo! Search API开发自已的搜索引擎-javascript版

美国东部时间3月1日,雅虎公司联合创始人之一的杨致远将宣布公司的搜索网络将进入Web服务。雅虎公司在www.developer.yahoo.com网站建立了Yahoo Search Developer Network,公司计划在此纽约举行的搜索引擎战略大会(Search Engine Strategies Conference)上推出这一计划。该网络将允许开发者在雅虎搜索之上建立新的应用程序,其中包括图像、视频、新闻以及地区搜索等内容。想要使用这项服务的会员必须先去http://api.search.yahoo.com/webservices/register_application 申请一个自已的ID号,注:每个ID号每天只能搜索5000次。 下面我们看一下,如何用javascript脚本调用Yahoo! Search API实现搜索的效果,全部脚本如下: ...
类别:网页编程 - JavaScript    查看:152    更新:2014-05-26

面向搜索引擎的客户端“自动转向”技术

“自动转向”技术一:什么是自动转向技术(Auto-Redirecting)?自动转向,也叫自动重定向。自动跳转,指当访问用户登陆到某网站时,自动将用户转向其它网页地址的一种技术。转向的网页地址可以是网站内的其它网页,也可以是其它网站。通常情况下,浏览器会收到一个网页,该页面含有自动加载一其它网页的代码。该页面有可能在服务器端被转换,这样的话,浏览器只收到一个页面,而自动转向往往意味着浏览器收到的页面具有自动将访问用户送至其它页面的功能。对自动转向技术的合理应用包括:将用户转向到指定浏览器的网页版本;当网站的域名变更或删除后将人们转向到新域名下,等等。但现在这种技术却往往被搜索引擎优化人士用来作为提高网站的搜索引...
类别:网页编程 - JavaScript    查看:145    更新:2014-05-21

深入理解PHP之字符串搜索系列函数的实现

今天和同事在讨论关键字过虑的算法实现,前几天刚看过布隆过滤算法,于是就想起我们公司内部的查找关键字程序,好奇是怎么实现的。于是查找了一下源代码,原来可以简单地用stripos函数查找, stripos原型如下: 以下为引用的内容: int stripos ( string $haystack, string $needle [, int $offset] ) 一般地都会建一个关键词库,然后把用户输入的内容作为haystack,然后循环遍历一下关键词库,把每个关键词作为needle,如果存在的话则会返回关键字在输入的内容中的位置。 于是查找了一下PHP源代码关于这个函数的实现,如果想知道一个函数在PHP的哪个模块的话可以简单写一个函数get_module.php 以下是PHP代码:【复制代码】 <?p...
类别:网页编程 - PHP技术    查看:135    更新:2014-05-19

抓取搜索引擎(Google)搜索结果数字的代码

function String_html($url) //fopen方式获取url对应的html代码,返回没有过滤html的正文 { $OutString = ""; $fp = fopen($url,"r"); while(!feof($fp)) { $OutString .= fgets($fp); } fclose($fp); return $OutString; } function match_google($url) { $html = googleHTML("www.google.cn", $url); preg_match_all( "/<b>([0-9,]+)</b>/" ,$html, $res); //print_r($res[0]); //print_r($res[1]); return $res[1][0]; } //由于Google对php的自动抓取函数fopen不响应,所以采用socket的方式请求数据 function googleHTML($host, $url) { $httph...
类别:网页编程 - PHP技术    查看:161    更新:2014-05-19

利用Yahoo! Search API开发自已的搜索引擎-php版

美国东部时间3月1日,雅虎公司联合创始人之一的杨致远将宣布公司的搜索网络将进入Web服务。雅虎公司在www.developer.yahoo.com网站建立了Yahoo Search Developer Network,公司计划在此纽约举行的搜索引擎战略大会(Search Engine Strategies Conference)上推出这一计划。该网络将允许开发者在雅虎搜索之上建立新的应用程序,其中包括图像、视频、新闻以及地区搜索等内容。想要使用这项服务的会员必须先去http://api.search.yahoo.com/webservices/register_application  申请一个自已的ID号,注:每个ID号每天只能搜索5000次。     下面我们看一下,如何用PHP脚本调用Yahoo! Search API实现搜索的效果...
类别:网页编程 - PHP技术    查看:137    更新:2014-05-19

preg_replace——执行正则表达式的搜索和替换

mixed preg_replace ( mixed pattern, mixed replacement, mixed subject [, int limit]) 在 subject 中搜索 pattern 模式的匹配项并替换为 replacement。如果指定了 limit,则仅替换 limit 个匹配,如果省略 limit 或者其值为 -1,则所有的匹配项都会被替换。  replacement 可以包含 n 形式或(自 PHP 4.0.4 起)$n 形式的逆向引用,首选使用后者。每个此种引用将被替换为与第 n 个被捕获的括号内的子模式所匹配的文本。n 可以从 0 到 99,其中&nbs...
类别:网页编程 - PHP技术    查看:134    更新:2014-05-19

MySQL全文搜索的SQL写法学习

首先,大家先去下载一份dvbbs.php beta1的代码,解压后先抛开php代码,找出你的mysql手册,如果没有手册那么就直接看下面的实例操作吧! mysql全文搜索,sql的写法: MATCH (col1,col2,…) AGAINST (expr [IN BOOLEAN MODE | WITH QUERY EXPANSION]) 比如: SELECT * FROM articles WHERE MATCH (title,body) AGAINST (’database’); MATCH()函数对于一个字符串执行资料库内的自然语言搜索。一个资料库就是1套1个或2个包含在FULLTEXT内的列。搜索字符串作为对 AGAINST()的参数而被给定。对于表中的每一行, MATC...
类别:数据库 - MySQL    查看:110    更新:2014-05-19

在MySQL中获得更好的全文搜索结果

很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。 MySQL针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然语言来智能地对结果评级,以去掉不相关的项目。 这篇...
类别:数据库 - MySQL    查看:103    更新:2014-05-19

mysql全文搜索问题

今天在写这个网站的全文搜索的时候遇到了一些问题,开始的时候我是这样写的SELECT * FROM `article` WHERE ti like '%a%' or con like '%a%' 这样是可以的,后来一个哥们告诉我这样多个like的话会出对服务器和数据库的压力比较大的,建议我用全文搜索吧。找了半天,找到这个文章,还不错的吧。 对于全站搜索,或者是一些大容量的搜索很有用的。ok,认真看吧。 到 3.23.23 时,mysql 开始支持全文索引和搜索。全文索引在 mysql 中是一个 fulltext 类型索引。fulltext 索引用于 myisam 表,可以在 create table 时或之后使用 alter table 或 create index 在 char、varchar 或 text 列上创建。对于大的数据库,将数据装载到一个没有...
类别:数据库 - MySQL    查看:118    更新:2014-05-19

如何在MySQL中获得更好的全文搜索结果

很多互联网应用程序都提供了全文搜索功能,用户可以使用一个词或者词语片断作为查询项目来定位匹配的记录。在后台,这些程序使用在一个SELECT查询中的LIKE语句来执行这种查询,尽管这种方法可行,但对于全文查找而言,这是一种效率极端低下的方法,尤其在处理大量数据的时候。 MySQL针对这一问题提供了一种基于内建的全文查找方式的解决方案。在此,开发者只需要简单地标记出需要全文查找的字段,然后使用特殊的MySQL方法在那些字段运行搜索,这不仅仅提高了性能和效率(因为MySQL对这些字段做了索引来优化搜索),而且实现了更高质量的搜索,因为MySQL使用自然语言来智能地对结果评级,以去掉不相关的项目。 这篇文...
类别:数据库 - MySQL    查看:93    更新:2014-05-19

FTP搜索引擎指南

FTP 搜索引擎 FTP搜索引擎的功能是搜集匿名FTP服务器提供的目录列表以及向用户提供文件信息的查询服务。由于FTP搜索引擎专门针对各种文件,因而相对WWW搜索引擎,寻找软件、图像、电影和音乐等文件时,使用FTP搜索引擎更加便捷。国外著名的FTP搜索引擎 http://www.philes.com 号称全球最大的FTP搜索引擎。http://www.alltheweb.com fastsearch.com的产品。http://www.filesearching.com Chertovy Kulichki Inc.的产品。http://www.souborak.com internauci.pl的产品。http://www.ftpfind.com www.echo.fr的产品 。http://parker.vslib.cz 作者是Technical University of Liberec Czech Republic的Jiri A. Ran...
类别:其它 - 协议大全    查看:151    更新:2014-05-09

解析搜索引擎收录页面流程原理和方式

搜索引擎收录页面实际上就是在互联网上进行数据采集,这是搜索引擎最基础的工作,而搜索引擎的内容都来自后台的庞大的URL列表,通过这些URL,不断的收录,储存及维护,而学习搜索引擎收录的流程,收录原理及收录方式,有效的提高搜索引擎对网站的收录的数量。1. 页面收录流程,在互联网中,URL是每个页面的入口地址,”蜘蛛程序”通过这些URL列表抓取到页面的,“蜘蛛”不断的从这些页面中获取URL资源及存储页面,并加入URL列表,如此不断的循环,搜索引擎就可以从互联网中获取到足够的页面。URL是页面的入口,则域名则是网站的入口,搜索引擎就是通过域名进入网站,挖掘URL资源,换而言之搜索引擎在...
类别:网页编程 - SEO网页优化    查看:151    更新:2014-05-08

搜索引擎如何确定你的就是原创内容

很多人在群里聊到一些事情,比如原创是如何被搜索引擎确定的?今天分享一下自己对搜索引擎确定原创内容的看法。 首先我们明确两个概念:原创与伪原创 原创:简单地理解就是第一次在网络上发表的内容。 伪原创:就是对原创进行的第二次或者第N次经过修改的转载发表。比如修改标题,增加摘要,转载不完整内容等等。 搜索引擎对于原创的判断是如何进行的呢? 一般来讲有以下几个方面的因素决定: 1、快照日期。 2、蜘蛛抓取日期。 3、页面外链的多少。 4、文章修改的程度。 举例:如果一篇标题为《搜索引擎如何确定你的就是原创内容》的文章在今天10点第一次发表在一个博客或者网站上。会有什么结果呢? 搜索引擎蜘蛛来到这个博客或者网站,发现这个页...
类别:网页编程 - SEO网页优化    查看:125    更新:2014-05-08

内容型网站面向搜索引擎蜘蛛和搜索用户的优化

面向机器的抓取优化1 缺省域名唯一化:缺省goalercn.com 设置301跳转到 www.goalercn.com 一方面减少搜索引擎页面消重的负担,一方面可以将针对相同内容的反向链接权重汇总。对于缺省使用https访问的网站,如果不跳转(比如以前的支付宝),往往还会有浏览器提示安全证书路径不匹配的问题; 另外: 在Google Webmaster tools中也有缺省域名的配置;2 被遗忘的流量:想办法搜集域名解析失败和拼写错误导致的流量流失;曾经启用过的域名,就尽量不要删除,一直保留并设置转向到最新的地址;有渠道取到DNS的这种记录吗?3 404页面的运营:返回hard 404(返回http header而不是html 404 header),统计并跟踪带有referer的404日志,修正这些问题;...
类别:网页编程 - SEO网页优化    查看:145    更新:2014-05-08

针对搜索引擎最佳方式:8个步骤优化网站

 每个网站在建立和完善的时候,都在偏向于搜索引擎的嗜好,这是在流量为王的互联网时代不可避免的,毕竟百度、google等搜索引擎是流量入口。那如何优 化你的网站,让你的网站从百度、google等搜索引擎分走更多的流量呢?从以下8个步骤做起,绝对能找到针对搜索引擎的最佳方式:1、内容在注册网址之前就应该先搜集至少一百页的内容,这些内容必须是有价值的、不违反著作权的内容。每天建立一个500~1000字的网页,当然这个网页里面必须包含你重要的关键字,如果想不出关键字来的话,可以使用Yahoo的关键字建议工具。每天都要生产一个有内容的页面。长期来说,当然是有主题的文章比较有效,尽量减少个人文章、过短的文章等等,并且请注意你的...
类别:网页编程 - SEO网页优化    查看:123    更新:2014-05-08

搜索引擎技术揭密:排序技术

随着“眼球经济”席卷互联网,成千上万的资金迅速流向最能吸引浏览着眼球的搜索引擎市场。有大量调查显示搜索引擎市场正处在高速发展时期,成为了未来几年内最具发展潜力的产业之一。随着Google、百度、中国搜索等各具特色的搜索引擎逐渐成为人们最常用的网络工具,企业对搜索引擎的注意力也从“观察”升级为“动武”。随着市场容量和使用者人数的不断激增,如何完善搜索功能使之更加公平、公开、标准和人性化也就随之成为了一个备受关注的话题。但是有一个矛盾体在这其中不断的显现出来:收费可以为搜索引擎公司带来利润,但同时会降低访问者的体验满意度。如何权衡金钱和用户需求之间的天平呢?Google成功的秘...
类别:网页编程 - SEO网页优化    查看:114    更新:2014-05-08