Bimatampan’s Weblog

Agustus 22, 2008

[PERL] URL Link Grabber

Diarsipkan di bawah: blog — bimatampan @ 8:49 am

Jika anda melihat satu halaman web dan ingin mengambil semua alamat URL yang ada di halaman tersebut, maka anda membutuhkan Link URL Grabber. Aku menyusunnya berdasarkan contoh di dokumentasi perl modul HTML::LinkExtor dan skrip rss2html. Jadi sebagian kode diambil dari kedua sumber di atas. Berikut ini kode sumbernya :

 #!/usr/bin/perl</blockquote>
<blockquote>#</blockquote>
<blockquote>use strict;
use LWP::UserAgent;
use HTML::LinkExtor;
use URI::URL;
use Getopt::Std;

getopts('t:f:');
our($opt_t, $opt_f);

my $url = $opt_t;  # for instance
my $log = $opt_f;
my $item;
my $ua = LWP::UserAgent-&gt;new;

die("\n[~] Must be fill the target url !!!\nUsage : $0 -t \"http://www.google.co.id\" -f \"tesku.html\"\n") if not ($opt_t);

# Set up a callback that collect image links
my @imgs = ();
sub callback {
my($tag, %attr) = @_;
return if $tag ne 'a';  # we only look closer at &lt;img ...&gt;
push(@imgs, values %attr);
}

# Make the parser.  Unfortunately, we don't know the base yet
# (it might be diffent from $url)
my $p = HTML::LinkExtor-&gt;new(\&amp;callback);

# Request document and parse it as it arrives
my $res = $ua-&gt;request(HTTP::Request-&gt;new(GET =&gt; $url),
sub {$p-&gt;parse($_[0])});

# Expand all image URLs to absolute ones
my $base = $res-&gt;base;
@imgs = map { $_ = url($_, $base)-&gt;abs; } @imgs;

# Print them out
#print join("\n", @imgs), "\n";

&amp;printlog(&lt;&lt;HTML);
&lt;title&gt;Result of Live Link Extractor&lt;/title&gt;
&lt;table bgcolor="#000000" border="0" width="200"&gt;&lt;tr&gt;&lt;td&gt;
&lt;TABLE CELLSPACING="1" CELLPADDING="4" BGCOLOR="#FFFFFF" BORDER=0 width="100%"&gt;
&lt;tr&gt;
&lt;td valign="middle" align="center" bgcolor="#EEEEEE"&gt;&lt;font color="#000000" face="Arial,Helvetica"&gt;&lt;B&gt;&lt;a href="http://bimatampan.wordpress.com"&gt;BimaTampan's Blog&lt;/a&gt;&lt;/B&gt;&lt;/font&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td&gt;
HTML

# print the channel items
foreach $item (@imgs) {
#next unless defined($item-&gt;{'title'}) &amp;&amp; defined($item-&gt;{'link'});
&amp;printlog("&lt;li&gt;&lt;a href=\"$item\"&gt;$item&lt;/a&gt;&lt;BR&gt;\n");
}

&amp;printlog(&lt;&lt;HTML);
&lt;/td&gt;
&lt;/TR&gt;
&lt;/TABLE&gt;
&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;
HTML

sub printlog {
print $_[0];
open(LOO,"&gt;&gt;$log");
print LOO $_[0];
close(LOO);
return;
} 

Skrip ini akan men-download halaman yang dimaksud dan kemudian akan mem-parsing-nya dengan mengumpulkan hasilnya ke sebuah array (kumpulan link URL), terakhir akan menampilkan isi array tersebut ke sebuah file html yang berisi live link URL nya (bisa diklik langsung). Contoh :

 E:\data\linkextract&gt;linkex_0003.pl -t "http://www.google.co.id" -f "tes123.html" &lt;title&gt;Result of Live Link Extractor&lt;/title&gt;
&lt;table bgcolor="#000000" border="0" width="200"&gt;&lt;tr&gt;&lt;td&gt;
&lt;TABLE CELLSPACING="1" CELLPADDING="4" BGCOLOR="#FFFFFF" BORDER=0 width="100%"&gt;
&lt;tr&gt;
&lt;td valign="middle" align="center" bgcolor="#EEEEEE"&gt;&lt;font color="#000000" fac
e="Arial,Helvetica"&gt;&lt;B&gt;&lt;a href="http://bimatampan.wordpress.com"&gt;BimaTampan's Bl
og&lt;/a&gt;&lt;/B&gt;&lt;/font&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td&gt;
&lt;li&gt;&lt;a href="http://images.google.co.id/imghp?hl=id&amp;tab=wi"&gt;http://images.google
.co.id/imghp?hl=id&amp;tab=wi&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://groups.google.co.id/grphp?hl=id&amp;tab=wg"&gt;http://groups.google
.co.id/grphp?hl=id&amp;tab=wg&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://books.google.co.id/bkshp?hl=id&amp;tab=wp"&gt;http://books.google.c
o.id/bkshp?hl=id&amp;tab=wp&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://blogsearch.google.co.id/?hl=id&amp;tab=wb"&gt;http://blogsearch.goo
gle.co.id/?hl=id&amp;tab=wb&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://mail.google.com/mail/?hl=id&amp;tab=wm"&gt;http://mail.google.com/m
ail/?hl=id&amp;tab=wm&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/intl/id/options/"&gt;http://www.google.co.id/i
ntl/id/options/&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/dirhp?hl=id&amp;tab=wd"&gt;http://www.google.co.id
/dirhp?hl=id&amp;tab=wd&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://picasaweb.google.co.id/home?hl=id&amp;tab=wq"&gt;http://picasaweb.g
oogle.co.id/home?hl=id&amp;tab=wq&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://docs.google.com/?hl=id&amp;tab=wo"&gt;http://docs.google.com/?hl=id
&amp;tab=wo&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/url?sa=p&amp;pref=ig&amp;pval=3&amp;q=http://www.google
.co.id/ig%3Fhl%3Did%26source%3Diglk&amp;usg=AFQjCNEaYzT2ATjWTNBxNj1-0CqEhXatDA"&gt;http
://www.google.co.id/url?sa=p&amp;pref=ig&amp;pval=3&amp;q=http://www.google.co.id/ig%3Fhl%3D
id%26source%3Diglk&amp;usg=AFQjCNEaYzT2ATjWTNBxNj1-0CqEhXatDA&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="https://www.google.com/accounts/Login?continue=http://www.google.co
.id/&amp;hl=id"&gt;https://www.google.com/accounts/Login?continue=http://www.google.co.
id/&amp;hl=id&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/search?q=Beijing+2008&amp;hl=id"&gt;http://www.goo
gle.co.id/search?q=Beijing+2008&amp;hl=id&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/advanced_search?hl=id"&gt;http://www.google.co
.id/advanced_search?hl=id&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/preferences?hl=id"&gt;http://www.google.co.id/
preferences?hl=id&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/language_tools?hl=id"&gt;http://www.google.co.
id/language_tools?hl=id&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/setprefs?sig=0_Wlj5UMtqXY_7NCUJX1ONlS1_TnU=
&amp;hl=en"&gt;http://www.google.co.id/setprefs?sig=0_Wlj5UMtqXY_7NCUJX1ONlS1_TnU=&amp;hl=e
n&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/setprefs?sig=0_Wlj5UMtqXY_7NCUJX1ONlS1_TnU=
&amp;hl=jw"&gt;http://www.google.co.id/setprefs?sig=0_Wlj5UMtqXY_7NCUJX1ONlS1_TnU=&amp;hl=j
w&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/intl/id/ads/"&gt;http://www.google.co.id/intl/
id/ads/&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.co.id/intl/id/about.html"&gt;http://www.google.co.id
/intl/id/about.html&lt;/a&gt;&lt;BR&gt;
&lt;li&gt;&lt;a href="http://www.google.com/ncr"&gt;http://www.google.com/ncr&lt;/a&gt;&lt;BR&gt;
&lt;/td&gt;
&lt;/TR&gt;
&lt;/TABLE&gt;
&lt;/td&gt;&lt;/tr&gt;&lt;/table&gt;

E:\data\linkextract&gt; 

kemudian coba lihat ke file tes123.html , silahkan diklik. Anda akan melihat semua alamat URL yang terkandung di halaman yang di-grabber tadi. Selamat mencoba. :)

Juli 23, 2008

antara komen, edit komen dan esensinya

Diarsipkan di bawah: blog, curhat, komputer, umum — bimatampan @ 8:50 pm

hari ini ada pelajaran yang berharga buatku….
bagaimana tidak, komenku ke sebuah blog yang nggak jelas, kemudian diedit oleh
si empunya blog, trus hasilnya apa ???

ternyata esensi isi komenku tersebut jauh sekali dengan komen yang telah diedit
oleh si empunya blog.
memang itu juga hak si empunya blog untuk mengedit komen yang masuk, termasuk apabila
komen yang masuk itu merugikan posisi dirinya (blognya), sehingga harus diedit sampai
menjadi komen yang menguntungkan posisi blognya.
tapi bagiku, tindakan tersebut adalah sama dengan tindakan orang yang tidak mau dikritik,
mau menang sendiri, dengan mengebiri pendapat orang lain.

so, inilah kenyataannya…….
selamat datang di dunia para blogger………
(sambil tersenyum kecut plus kesal).

catatan:
komenku ke blog yang nggak jelas tersebut tidak berisi cacian atau
rangkaian kata-kata mutiara yang kasar, namun cuman memberi ucapan selamat
karena postingannya tersebut berhasil masuk ke BOTD-nya wordpress dengan
isi postingan yang bernada provokatif dan cenderung ke arah SARA.
dan yang tertampil di blognya sbb :


selamat ya bro, anda memang bagus.


:(

Juni 21, 2008

[update] CyberPhreaking Menu

Diarsipkan di bawah: komputer, seluler — bimatampan @ 4:38 am

cuman ngasih tahu……. :D

telah datang update CPMenu.

Beberapa perbaikan di cpmenu ini meliputi :
[+] fix di link advertising
[+] penambahan submenu di menu forum regional cyberphreaking
[+] penyesuaian di menu user control panel
[+] fix logo cpmenu (yg dulu tdk keliatan)
[+] fix id menu agar tidak crash dengan KaskusMenu

bisa diunduh di rapid.

Terima kasih kepada temen2 sekalian atas masukannya selama ini,

mohon agar kritik dan saran tetep diberikan ,

agar add-on ini lebih komplit lagi.

:)

Maret 31, 2008

Promo Indosat [lagi]

Diarsipkan di bawah: seluler — bimatampan @ 12:33 pm

Hari ini akyu dapet sms dari temen, yang isinya sebagai berikut :

per tgl 31/3/2008 tarif nelpon IM3 HANYA Rp 480 , berlaku pukul 23-11 sesama ISAT. Fitur sms: 10 gratis 10, CS-an, voucher sms TETAP BERLAKU. GPRS Rp 1,1/kb – ISAT KDR.

Berlaku sampai dengan 30 April 2008.

Kalo mentari, dapet info dari temen juga :

isi ulang mulai 10 ribu ke atas, dapat bonus 50 persen, jadi kalo ngisi 10 ribu, dapetnya 15 ribu, dan seterusnya.  Berlaku sampai kapan ??? Lha itu dia, akyu belum tau…. :)

nah selamat menikmati…..  (jaringan lambat dan sibuk lagi)….

CyberPhreakingMenu [Firefox Add-ons]

Diarsipkan di bawah: komputer, seluler — bimatampan @ 4:50 am

Akses yang cepat ke forum kesayangan kita merupakan suatu hal yang disukai oleh para netter, padahal kondisi koneksi internet di negara kita paling sering lemotz…..

Salah satu solusinya adalah dengan menggunakan bookmark di browser kesayangan kita, firefox, tapi cukup capek juga kalau harus menyusunnya satu persatu.

Solusi yang lain adalah menyusun add-ons di firefox yang gunanya adalah juga mempercepat akses ke forum kesayangan, dengan menu – menu yang ada di dalamnya.

cyberphreaking menu fast access

Atas request teman – teman di room CP_brotherhood, maka saya menyusun add-ons yang tujuannya memunculkan menu – menu yang ada di forum.

Add-ons di atas bisa anda download di rapidshare atau cakung.
Mendukung firefox v1.5 sampai dengan v4.*

Semoga bisa membantu teman – teman terutama yang akses internetnya “agak” lambat dan “suka” putus – putus (idle).

Kalau ada bug atau eror, mohon dilaporkan ke forum atau kasih komen di sini…

Terima kasih kepada fich atas karyanya (kaskusmenu.xpi), yang telah mengilhami CPmenu ini.

[EOF]

Desember 13, 2007

Hello world!

Diarsipkan di bawah: umum — bimatampan @ 3:50 am

Welcome to WordPress.com. This is your first post. Edit or delete it and start blogging!

« Tulisan Lebih Baru

Blog pada WordPress.com.