Categories

Calendar

June 2009
M T W T F S S
« May   Jul »
1234567
891011121314
15161718192021
22232425262728
2930  

毕业了

你说我就如湖水一样平静,可是我无法预料当今晚回到寝室后发现只剩下一片凌乱和我自己一个人时,我应该如何保持平静,也许有你留下的一点有用的东西呢,你们留下的其他东西我大概可以拿去卖掉换一个西瓜呢,可是我是要学你那样子在屋子中间铺上一个凉席,然后把音乐开起来吗?或者是要学你那样一个人静静地把整个房间再打扫一遍?或者是要学你那样站在十一楼的阳台,只望着外面的一片漆黑发呆?亦或者是装作什么事都没有发生过一样,爬上床去睡觉,明天早上起床去四食堂买馒头吃,然后去实验室干活,然后去自习室学习?

Linux 下 Thinkpad 多媒体键 OSD

Thinkpad 的键盘上有一些特殊地按键如音量控制等,在 Linux 下可以通过 tpb 这个工具利用起来,tpb 可以识别这些按键并执行一系列地操作,例如调用某个脚本或者用 xosd 在屏幕上显示(音量、亮度等)一个状态。不过我新装的这个 Arch Linux 的 tpb 在 Thinkpad X200 下工作不太正常,于是用了另一个办法来解决,使用很浮云地 notify-osd 加上自制的脚本来实现相同的目的。

以下是废话:
最近频繁地背着笔记本往来于 ZJG 和 YQ 两个校区,原来那个 Thinkpad R60e 不仅非常重,而且散热量非常大,看到毕业结算的时候学校退了一些学费,于是加上自己攒的一些钱买了一个 Thinkpad X200 ,顿时感觉好轻呀!

Gracefully Shutdown in openbox

懒散了很长一段时间,一直持续本本 Windows XP 实验室 Ubuntu 的状态,最近终于借“毕业了要喜庆一下”的理由又给本本装了一个 Linux 。虽然仍旧很懒散,但是毕竟是自己的本本,还是喜欢清爽一点,因此用了 openbox 作为窗口管理器,tint2 作为任务栏,用了一周左右挺舒服的。

不过有一个小问题,就是我希望从 openbox 中 shutdown 、restart 的时候能像在 Gnome 或者 KDE 的 session 中那样“优雅”地退出,然后 login manager 也退出,然后屏幕上显示正在关闭的服务,而不是要暴力地直接运行 sudo shutdown -r now 然后屏幕直接黑掉,需要看指示灯才能知道什么时候机器真正关掉了。另外,在 Gnome 或者 KDE 中从对应的 GDM/KDM 中登录进来的话,关机是不需要 sudo 权限的。

解决 ibus 在 gVim/Emacs 下不能使用的问题

ibus 是 Linux 下一个比较新的输入法框架,其下的 ibus-pinyin 也是比较不错的一个输入法,不过整个项目相对来说还是比较新,所以偶尔也还会有一些小问题,并不是诡异的 bug 或者是开发难度上不可行,只是大概还有跟多优先级更高的模块需要处理,比如之前说过的用 Ctrl 切换中英文状态的问题。事实上如果只是自己用的话,做一点小小的 dirty hack 也是非常方便的事情,因为 ibus 是用 Python 写的,直接修改系统中对应的文件即可,甚至都不用重新编译。

如题目所说,今天要解决的问题是 ibus 在 gVim 和 Emacs 下不能使用的问题。先说 Emacs 吧,这个似乎是一个老问题了,症状就是在 Emacs 里不能激活输入法,好像从数年前开始就一直都有类似的问题,包括 scim、 fcitx 等众多输入法在内都有过类似的问题,似乎是一部分 Gnome 用户会遇到,在 Emacs 里无法激活输入法,但是也有另外一些人正常使用,所以后来似乎也没弄明白原因,这里的问题我也不确定是不是同一个,但是症状确实挺像。

漫谈 Clustering (番外篇): Dimensionality Reduction

本文是“漫谈 Clustering 系列”中的第 7 篇,参见本系列的其他文章。

由于总是有各种各样的杂事,这个系列的文章竟然一下子拖了好几个月,(实际上其他的日志我也写得比较少),现在决定还是先把这篇降维的日志写完。我甚至都以及忘记了在这个系列中之前有没有讲过“特征”(feature)的概念了,这里不妨再稍微提一下。机器学习应用到各个领域里,会遇到许多不同类型的数据要处理:图像、文本、音频视频以及物理、生物、化学等实验还有其他工业、商业以及军事上得到的各种数据,如果要为每一种类型的数据都设计独立的算法,那显然是非常不现实的事,因此,机器学习算法通常会采用一些标准的数据格式,最常见的一种格式就是每一个数据对应欧几里德空间里的一个向量。

如果原始的数据格式不兼容,那么就需要首先进行转换,这个过程通常叫做“特征提取”(Feature Extraction),而得到的标准数据格式通常叫做 Feature 。例如,一个最简单的将一个文本 Document 转化为向量的方法如下: