loading...

如何处理海量数据

发布时间:November 15, 2010 分类:闲言碎语 No Comments

数据一多,看起来就麻烦了,想处理它们,可以有两个思路:
1、减少数量
2、有序化

降噪去掉可能造成干扰的信息,将核心特征抽象出来,进行分类,可能的话进行压缩,这个过程需要有明确的目标,也就是数据处理为目标服务。

--Back to top--

怎样用google app engine搭建一个gtalk群

发布时间:November 10, 2010 分类:资源资料 No Comments

要感谢gtalkgroups这个开源项目,作者及详细说明看http://io43.com/io43.GtalkGroup/

1、从http://code.google.com/p/gtalkgroups/downloads/list下载gtalkgroup_release.tar.gz

2、解压之后有两个文件需要修改
m2ggg_config.py

root_gmail='your.mail.@gmail.com'

这一行改成自己的gmail,该帐号具有管理员权限
protect_key1='key1'
protect_key2='key2'

这两个key修改一下,随便写

app.yaml

application: your_app_name

这改成自己的app名称,如my_gtalk_groups
- url: /chatbridge

改成一个随机地址,如:
- url: /chatbridgecgdsgfsgdh

3、将这个应用上传到google app engine,添加my_gtalk_groups@appspot.com就可以了(你自己的appspot地址)。如何上传看http://code.google.com/appengine/docs/python/gettingstarted/uploading.html

需要注意的是,google app engine sdk是python2.x的,所以请安装python2.5或2.6

群应用及管理的命令如下:
UserCmd (普通用户指令)
//online
用途:显示在线人员名单
//nick
用途:设置昵称
示例://nick 你好
说明:如果群里有其他人使用相同昵称则该昵称不能设置
//setid
用途:设置FID
示例://setid hello
说明:如果群里有其他人使用相同FID则该昵称不能设置。FID只能设置一次,重设无效。
//block
用途:屏蔽某人的消息
示例://block hello
说明:后面所跟的参数为FID。上面示例所的执行结果是屏蔽了FID为hello的用户的消息。
//unblock
用途:取消屏蔽某人的消息
示例://unblock hello
说明:后面所跟的参数为FID。上面示例所的执行结果是取消屏蔽FID为hello的用户的消息。
//m
用途:给某人发送私密消息
示例://m hello helloworld
说明:后面所跟的参数为FID和内容。上面示例所的执行结果是把私密消息helloworld发送到FID为hello的这个用户。发送成功会显示OK的。目前不能发送消息给形如@***||*** 这样的外连接用户。
//showinfo
用途:显示某人的基本信息
示例://showinfo hello
说明:后面所跟的参数为FID。上面示例所的执行结果是输出FID为hello的用户的基本资料。
//stop
用途:马上停止接收群内消息,直到若干秒后恢复
示例://stop 3600
说明:后面所跟的参数为秒数。上面示例所的执行结果是在一小时(3600秒)内不接收群内消息。如果重复输入此命令,时间不会叠加,以最后的一次执行为准。如果执行//stop -1,则取消屏蔽,马上显示消息。
//continue
用途:停止屏蔽群内消息,作用等同于//stop -1 
//help
用途:输出帮助内容——指令的简单说明。

AdminCmd(管理员指令)
//whois
用途:查看某人消息
示例://whois hello
说明:参数必须为FID。使用whois可以获取用户的电邮,以供后面的其他指令作为参数用。
//blacklist
用途:将某人加入群黑名单
示例://blacklist somebody.you.want.to.disable@gmail.com
说明:参数为用户email
//pass
用途:把某人从黑名单上移除
示例://pass remove.from.blacklist@gmail.com
说明:参数为用户email
//admin
用途:设置某人为管理员
示例://admin admin.of.group@gmail.com
说明:参数为用户email
//unadmin
用途:解除某人的管理员身份
示例://unadmin not.a.admin.of.group@gmail.com
说明:参数为用户email
//add
用途:增加一个成员
示例://add new.member@gmail.com
说明:填写email,若email为已有成员,则执行指令后用户资料会被重新初始化。
//addrouterecv
用途:创建HTTP消息接收通道。
示例://addrouterecv mychannel2 hello.mypassword2 mychannel1
说明:后跟3个参数,分别是名字、密码和回路禁止。示例的执行结果是:创建一个外挂消息接收点,名字叫mychannel2,密码是hello.mypassword2,收到的消息不用重新转发给mychannel1
//addroutesend
用途:创建HTTP消息发送通道
示例://addroutesend mychannel1 hello.mypassword1 http://some.of.mychannel1.some.appspot.program
说明:后跟3个参数,分别是名字、密码和接收消息的地址。示例的执行结果是:建一个外挂消息发送器,名字叫mychannel1,密码是hello.mypassword1,消息发送到http://some.of.mychannel1.some.appspot.program上。若在服务器http://some.of.mychannel1.some.appspot.program创建同样的名字和密码(mychannel1和hello.mypassword1)的接收点,并禁止回路mychannel2,则对方会收到此聊天群发出的消息,并且不回送。
//allok
用途:通过所有没有进入群的用户
//listuser
保留,原意是提供用户列表,但是GAE后台能显示,所以没有加上

--Back to top--

腾讯VS360舆论之战的关键是“谁是恶人”

发布时间:November 4, 2010 分类:闲言碎语 1 Comment

商人之战,逐利而动,没有正邪之说,这场战斗的关键问题是让用户明白“谁是恶人”,哪怕只是表象。

这里隐含了一个默认前提:恶人欺负好人。如果用户认为是360不让QQ与安全卫士并存,那么QQ就是受害者,可现实是在QQ祭出“给用户选择权”这个大杀器时,“恶人”的帽子就戴上了,会造成QQ不让两者并存的认知,使360处于表象上的弱势地位,能够有效获得部分用户的同情感,进而忽视“好人”未必是“好人”,只关注谁是“恶人”,360适时撤下扣扣卫士也是示弱的行为,可以夯实腾讯的恶人地位,在舆论战(娱乐战)中获得支持。

社会心理学研究表明,说服的途径有两种:
1、中心途径,也就是关注论据,如果论据强有力,人们就容易被说服。360先出手,攻击QQ扫描硬盘,并推出软件来给用户重现过程,利用“安全厂商”的高可信度背景,唤起用户对隐私被侵犯的恐惧(恐惧是一种强烈的情感),把问题定位在有利论据充分的“是不是扫描”上,而不是像腾讯一样纠缠于“扫描是不是安全”,简化的用户接受观点的过程,为自己的论点提供了支持,反观腾讯只是强调扫描硬盘是安全行为,未能提供是如何安全的论据去解除恐惧。
2、外围途径,也就是关注用户不假思索就能接受的外部线索而不考虑论据是否充分。360的文章多用图片视频,集中反复强调“扫描硬盘”这个行为,文字上简洁有力,反观腾讯的反驳文晦涩难懂,无疑是在外围途径上的失策。

--Back to top--

中国电信爱音乐网推出哼唱搜索功能

发布时间:November 3, 2010 分类:闲言碎语 No Comments

先上链接
http://search.118100.cn/singsearch/index.html

因为爱音乐网的手机客户端有这样的应用,所以可以确定这个网页上的哼唱搜索是来源于同一个技术,我估计是找科大讯飞外包的技术。

有百度之前的哼唱搜索刚下线,电信又跟着发布,那厢还有盛大说要开源哼唱搜索,实力的企业都在涉足哼唱搜索,这个应用真是热了,

--Back to top--

scite-for-php,基于SciTE重新编译定制的PHP编辑器

发布时间:November 1, 2010 分类:资源资料 No Comments

这是一个中文的scite定制项目,地址是:
http://code.google.com/p/scite-for-php/

重新编译修改项:
增强PHP代码高亮颜色;
增加项目管理文件树, 对项目管理更加方便;
增加二级菜单支持,工具栏、Tab右键菜单、编辑区右键菜单均支持二级菜单;
增强Snippets功能,编写代码效率可以变得更加高效;
修改状态栏,增加部件显示而不用去点击切换,状态栏增加实时显示文件编码;
内置UTF8编码自动判断而非通过lua实现,打开文件速度更快内存占用更低了;
新增OnMenuCommand事件,方便在执行菜单命令行调用lua代码;
新增OnStatusBarClick事件,单击状态栏相应part可以处理不同事件;
新增save.convert.indent属性,可以设置保存时是否统一(已设置的)缩进格式;
新增margin.click.bookmark属性,可以配置单击左边空白区域是否增加书签;
新增sidebar.dock属性,可以配置是否自动隐藏侧边栏。

scite-for-php,基于SciTE重新编译定制的PHP编辑器

--Back to top--