Fakultas Ilmu Komputer UI

TP4_2_1906399915.py 1.72 KB
Newer Older
Ruly Achmad Gemilang Gultom's avatar
Ruly Achmad Gemilang Gultom committed
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
import urllib.request

page = urllib.request.urlopen("https://stevensim226.github.io/TP4/statistics")
text = page.read().decode("utf8")

first_li_pos = 0
first_li_close_pos = 0

kucing = 0
kuliah = 0
mahasiswa = 0
kantin = 0
kos = 0
tugas = 0
tidakDitemukan = 0
hastag_tidakDitemukan = "" 

while text.find("<li>",first_li_pos+1) and text.find("</li>",first_li_close_pos+1) != -1:
    open_li = text.find("<li>",first_li_pos+1)
    close_li = text.find("</li",first_li_close_pos+1)
    found = False

    if "kucing" in text[open_li+4:close_li].lower():
        kucing += 1
        found = True
    elif "kuliah" in text[open_li+4:close_li].lower():
        kuliah += 1
        found = True
    elif "mahasiswa" in text[open_li+4:close_li].lower():
        mahasiswa += 1
        found = True
    elif "kantin" in text[open_li+4:close_li].lower():
        kantin += 1
        found = True
    elif "kos" in text[open_li+4:close_li].lower():
        kos += 1
        found = True
    elif "tugas" in text[open_li+4:close_li].lower():
        tugas += 1
        found = True
    elif not found:
        tidakDitemukan += 1
        hastag_tidakDitemukan += text[open_li+4:close_li] + " "
    first_li_pos = open_li
    first_li_close_pos = close_li

print("terdapat {} post untuk hashtag kucing".format(kucing))
print("terdapat {} post untuk hashtag kuliah".format(kuliah))
print("terdapat {} post untuk hashtag mahasiswa".format(mahasiswa))
print("terdapat {} post untuk hashtag kantin".format(kantin))
print("terdapat {} post untuk hashtag kos".format(kos))
print("terdapat {} post untuk hashtag tugas".format(tugas))
print("terdapat {} post untuk dengan hashtag tidak terklasifikasi".format(tidakDitemukan))
print("dengan hashtag: {}".format(hastag_tidakDitemukan))