可怜之人必有可恨之处

cat title.txt|LANG=C sed -n ‘s/.*<title>\(.*\)<\/title>.*/\1/ip;T;q’
日了.匹配中文必须有LANG=C

开始还以为\1在sed里不支持呢.

sed的说明文档

还有正则表达式在各种工具中的的微小区别:

正则迷雾,各种工具之正则表达式语法比较

 

LISTURL="http://www.stdjtu.edu.cn/pingjian.asp"
LISTKEY="pingjian.asp?newsid=[0-9]\{4\}"
HREFFILE="href.awk"
PAGEURL="http://www.stdjtu.edu.cn/admin/UploadFile/"
#2.22...
PAGEKEY="/admin/UploadFile/ea_[0-9]+\.rar"
#a=(`curl -s http://www.stdjtu.edu.cn/pingjian.asp|grep 'pingjian.asp?newsid=[0-9]\{4\}'|awk -f href.awk`)
a=(`curl -s $LISTURL|grep $LISTKEY|awk -f $HREFFILE`)
#echo ${a[@]}
for line in ${a[@]}
do
echo http://www.stdjtu.edu.cn/$line
curl -s http://www.stdjtu.edu.cn/$line|grep "/admin/UploadFile/ea_[0-9]*\.[a-z]\{3\}"|awk -f $HREFFILE
done

这里小记一下:)从头学shell真难受啊.旁边还没有好的书.好在这个东西就快完工了T_T
功能描述:
crul抓取学校成绩发布页,自动下载相关文件(学校的服务器嗷嗷的慢)并且将相关信息提交给jiwai.实现短信提醒.
不过学校的成绩发布页也够那个了标签后面居然没有 非成对出现,看来程序大体功能完工以后还需要完善n多的细节问题.问题链接在下面
http://www.stdjtu.edu.cn/pingjian.asp?newsid=2026&back=1

PS:昨天下雪了,今天刮风了.和一年前差不多.不同的是:一年前(阴历正月十六)我她在屋里.外面是风暴潮.现在只有我,外面也不可能有风暴潮了.感慨一下吧.最近周围很多分分和和的案例.大家都在不断的洗牌中.CCTV-6的想唱就唱不错.MM也不错.

发表评论

邮箱地址不会被公开。 必填项已用*标注


*