首页 技术教程 实用代码 注册破解 正则表达式 网址导航 电子书籍

PHP开发中文件操作疑难问答

前言:    PHP中对各类数据库的操作有着支持,对文件的操作也同样有着很丰富的操作方法,很多朋友现在的操作还是基于文件操作可是有的时候在操作文件的时候还存在不少的困惑和疑点,以下是我在日常编写过程中碰到的以及坛上朋友所碰到的关于文件操作的一些问题收藏吧。    问:如何新建一个文件?    答:    1、使用fopen("要建立的文件名","参数"),参数可选w,w+,a,a+    2、使用exec("echo '' > 要建立的文件名");这样是使用系统方式建立这个文件,你还可以使用touch这个linux命令来建立    问:为什么我无法建立文件?&nbs...
类别:网页编程 - PHP技术    查看:106    更新:2014-05-19

php写的中文分词类

class Segmentation {  var $options = array('lowercase' => TRUE,  'segment_english' => FALSE);  var $dict_name = 'Unknown';  var $dict_words = array();  function setLowercase($value) {  if ($value) {  $this->options['lowercase'] = TRUE;  } else {  $this->options['lowercase'] = FALSE;  }  return TRUE;  }  function setSegmentEnglish($value) {  if ...
类别:网页编程 - PHP技术    查看:105    更新:2014-05-19

基于MySQL数据库的UTF8中文网站全文检索的实现

现在的互联网上,很多网站都提供了全文搜索功能,浏览者可以通过输入关键字或者是短语来搜索特定的资料。在PHP+MySQL构架的网站中,通常的做法是通过SELECT查询的Like语句来进行搜索,这一办法存在搜索不够精确、以及效率非常低下的缺点。比如对一个有十几万条记录数据表的TEXT字段进行LIKE操作,可能会花费上近10秒钟左右,这对网站的浏览者来说是一个非常糟糕的使用体验。如何在海量的数据中能够快速的进行全文检索呢?MySQL提供了一个全文索引功能,也就是把字段设置上FULLTEXT索引属性,然后通过SELECT的MATCH AGAINST语句进行查找。 我们开发的一个纯英文站点TouchUs - The Globa...
类别:数据库 - MySQL    查看:114    更新:2014-05-19

让MySQL真正支持中文的全文检索(全文索引)

PHP 和 MySQL 几乎也是离不开的, 后面我附一个简单的例子来说明在 PHP 中使用全文检索.... 下载及完全说明正式地址: http://myft.twomice.net 在不影响 MySQL 的系统结构及其他功能的前提下,解决了 MySQL 目前对中文全文检索无法正确支持的缺陷并优化 MySQL 对中文检索处理的性能。(目前本软件包支持根据词典进行简易的正向最大匹配分词、支持包括UTF-8、GBK、BIG5 ... 在内的字符集) 经测试效果尚可, 140万行约 1.4G 数据(不含索引区空间) 检索大概都在 0.0x ~ 0.x 秒之间. 搭配...
类别:数据库 - MySQL    查看:118    更新:2014-05-19

MySQL中文排序错误的解决方法

一. 方法1  在MySQL中,进行中文排序和查找的时候,对汉字的排序和查找结果是错误的。这种情况在MySQL的很多版本中都存在。如果这个问题不解决,那么MySQL将无法实际处理中文。  出现这个问题的原因是:MySQL在查询字符串时是大小写不敏感的,在编绎MySQL时一般以ISO-8859字符集作为默认的字符集,因此在比较过程中中文编码字符大小写转换造成了这种现象,一种解决方法是对于包含中文的字段加上"binary"属性,使之作为二进制比较,例如将"name char(10)"改成"name char(10)binary"。二. 方法2   如果你使用源码编译MySQL,可以编译MySQL时使用--with--charset=gbk 参数,这样...
类别:数据库 - MySQL    查看:104    更新:2014-05-19

J2ME中文乱码问题的原因和解决方案

Java的中文问题通常会困扰很多开发者,你可能在开发Web应用程序的时候遇到中文参数的传递问题,最后你可能选择使用Filter把Request的编码方式设置为GBK来解决。在J2ME的开发中我们同样会遇到中文问题,比如在RMS中存储中文、网络传输中传输中文、从文件中读取中文等问题。 我们在解决中文问题的时候,用到的最多的一个词就是UTF-8。我们知道ASCII码是单字节编码方式,可以解决英文的问题,但是中文的字库非常庞大,用 ASSII码就难以解决了。Java语言是支持UNICODE编码方式的,UNICODE是双字节的编码方式可以支持中文字库,但是这多少带来一些浪费,因为并不是所有的字符串都是非英文字符的。UTF-8编...
类别:程序开发 - JAVA    查看:127    更新:2014-05-15

三种常见中文内码的转换方法

我们平时常见的三种中文内码是:GB2312(简体中文)、GBK、BIG5(繁体中文)。网上有很多中文内码的专用转换工具。我们碰到由于内码不一致而导致的乱麻问题,用这些工具可以进行相互转换。 但论坛里经常有人问如何在自己的程序中集成这些功能呢?本文将介绍如何利用 Windows 提供的API 函数来实现。转换涉及到的 API 函数主要有两个:MultiByteToWideChar 和 WideCharToMultiByte。有关这两个函数的详细文档请参考 MSDN,本文不再赘述。   本文将介绍四个转换函数分别实现如下的转换: * Big5 => GBK * GBK => Big5 * GB2312 => GBK * GBK => GB2312   有关 GB2312 =〉BIG5 的转...
类别:程序开发    查看:78    更新:2014-05-10

JNI中文处理问题小结

  由于工作关系,需要利用JNI在C++与Java程序之间进行方法调用和数据传递,但以前总是在英文环境下工作,对中文(其他语言编码同理)问题反倒没有太关注,最近抽了点时间研究了一下,将自己的体会整理如下,供大家讨论或参考。 在进一步讨论之前,有几点基础知识需要说明: 在Java内部,所有的字符串编码采用的是Unicode即UCS-2。Unicode是用两个字节表示每个字符的字符编码方案。Unicode有一个特性:它包括了世界上所有的字符字形。所以,各个地区的语言都可以建立与Unicode的映射关系,而Java正是利用了这一点以达到异种语言之间的转换; UTF-8是另一种不同于UCS-2/UCS-4的编码方案,其中UTF代表UCS Transform...
类别:程序开发    查看:87    更新:2014-05-10

英文SEO与中文SEO的八点不同之处

中文SEO主要面对的是百度,而英文SEO需要讨好Google.com(注意:不是google.cn)。下面就是英文SEO与中文SEO八点不同之处。1、程序语言不同英文需要采用utf或Iso,而中文都采用GBK的字符集。2、网页风格不同英文需要采用西方的阅读格式,譬如IBM和Microsoft的官方网站,风格简单,排版工整,最主要的是内容权威。中国的网站一拉往往几十版,各个角落充斥着各种广告和链接。3、推广方式不同英文站做链接,经常需要到国外的网站进行提交,随便一个中文免费博客或留言簿,是不起作用的。4、空间不同英文站需要国外空间,要不美国空间吧,稳定还价格便宜。5、域名不同英文的需要关键词在域名中,在栏目中,在文章页面名字中。6、S...
类别:网页编程 - SEO网页优化    查看:128    更新:2014-05-08

Word中只删除英文保留中文或删除中文保留英文

遇到一篇中英文混排的Word文章,想批量删除文档里的英文而只保留中文,有什么快速便捷的方法?答案当然是肯定的了。且看。在Word中只删除英文保留中文的方法在Word的“编辑”菜单选“查找”(或直接按ctrl+F快捷键),选“替换”标签,然后在查找内容后面输入^$,替换后面的内容留空,然后点击“全部替换”按钮即可删除所有英文字母。此外,也可以在查找和替换面板下面点“高级”按钮,在“特殊字符”按钮弹出列表那里选择“任意字母”,这是就看到查找内容文本框后面自动输入了“^$”字符。在Word中只删除数字的方法同上面的方法调出查找替换框,在&ldqu...
类别:其它 - 软件    查看:110    更新:2014-05-07

FCKEditor中文使用说明

首先,FCKEDITOR的性能是非常好的,用户只需很少的时间就可以载入FCKEDITOR所需文件.对于其他在线编辑器来说,这几乎是个很难解决的难题,因为在开启编辑器时需要装载太多的文件.比如CUTEEDITOR,虽然功能比FCKEDITOR还要强大,可是,它本身也够庞大了,至于FREETEXTBOX等,其易用性与FCKEDITOR相比,尚有差距,可以说,FCKEDITOR是一个别具匠心的在线编辑器,它里面融入了作者高深的面向对象的JAVASCRIPT功力,集易用性与强大的功能与一体..与编辑器相关的所有图像,脚本以及调用页.语言文件.编辑器的皮肤文件.工具样的贴图等这些将导致在服务器和客户端间产生相当的流量.如果有许...
类别:其它 - 软件    查看:132    更新:2014-05-07

FckEditor中文配置手册详细说明

javascript调用方式: ------------------------------------ <script. type=”text/javascript” src=”FCKeditor/fckeditor.js”></scrīpt> <textarea name=”content” cols=”80″ rows=”4″> </textarea> <script. type=”text/javascript”> var FCKeditor = new FCKeditor(”content”); oFCKeditor.BasePath = “FCKeditor/”; oFCKeditor.Height = 400; oFCKeditor.ToolbarSet = “Default”; oFCKeditor.ReplaceTextarea(); <...
类别:其它 - 软件    查看:114    更新:2014-05-07

PHP截取中文字符串方法大串烧substr各种解决办法

程序一:PHP截取中文字符串方法 由于网站首页以及vTigerCRM里经常在截取中文字符串时出现乱码(使用substr),今天找到一个比较好的截取中文字符串方法,在此与大家共享。 以下是PHP代码:【复制】 function msubstr($str, $start, $len) {$tmpstr = ""; $strlen = $start + $len; for($i=0;$i<$strlen;$i++) {if(ord(substr($str, $i, 1)) > 0xa0) {$tmpstr .= substr($str, $i, 2); $i++; }else {$tmpstr .= substr($str, $i, 1); }return $tmpstr; }} 程序二:PHP截取UTF-8字符串,解决半字符问题 以下是PHP代码:【复制】 /* PHP截取UTF-8字符串,解决半字符问题。 英文、数字(半角)为1字节(8位)...
类别:网页编程 - PHP技术    查看:114    更新:2014-05-05

ASP对XML文档中文本的增加、删除、修改、查看

<% '---------------------------------------------------------------- '程序简介: 完成asp语言对XML文档中指定节点文本的增加、删除、修改、查看 '入口参数: 无 '出口参数: 无 '------------------------------------------------ '函数名字:ConnectXml() '入口参数: filename 需要连接或打开的xml文件名 '出口参数: 无 '返回值 :ConnectXml=0,XMLMorntekDocument就是一个成功装载XML文档的对象了。 ' ConnectXml<>0,则打印错误信息strError '------------------------------------------------ dim XMLMorntekDocument function ConnectXml(filename) dim strSourceFile strSourceFile = Server.M...
类别:网页编程 - ASP技术    查看:119    更新:2014-05-04