hypertweeter 6.0
Vývoj hypertweeteru pokračuje hypertempem. Minule jsem naznačoval
začlenění OCR a teď ve verzi šest tečka nula tam je. Je třeba
nainstalovat tesseract
a v konfiguraci uvést adresu k programu. Pak se každý
stažený obrázek prožene přes OCR a text se uloží do souborů imgs/*.txt
,
připraven pro grepnutí, kdyby bylo potřeba.
Pak také došlo k vnitřní reorganizaci kódu. Už nabobtnal do příliš velkých rozměrů, ±1500 řádků, a bylo nutné ho jasně rozdělit na komponenty. Jde pouze o interní záležitost, zvenku není vidět, ale je naprosto nezbytná, aby se v tom někdo vyznal. Stejně tak není vidět změna serializačního formátu. Standardní mechanismus vyklidil místo jednoduché alternativě bez použití reflexe, která by měla být rychlejší a na disku kompaktnější. V důsledku téhle změny došlo k navýšení limitu, kolik tweetů se uchovává v paměti, z 4000 na 20000. Minule uvedené hledání teď může zajít víc do minulosti.
Další funkce je anti-timeline. Když se povolí v konfiguraci, klient pomalu
začne sbírat tajmlajny lidí, kteří vás sledují. To se používá dvěma způsoby.
Jednak se kompletní anti-timeline dá zobrazit na url /anti
, druhak (přes
java -jar tw.jar activity
) slouží pro statistiky o časech, kdy jsou lidé na
druhé straně drátu aktivní. Jsou živí ráno, v poledne, večer nebo v noci?
Odpověď může pomoct načasovat zprávy do doby, kdy je uvidí co nejvíc očí.
Něco podobného jsem udělal už dávno – skript, který stáhne timeline všech
followerů najednou a vizualizuje jejich denní aktivity. Jeden člověk (myslím, že to byl █████ Jo a nakonec ještě začínám přidávat nějakou nápovědu. Přepínače --help
nebo
-h
ukážou všechny způsoby použití skriptu.