kiri Skoro by som zabudol, pozeral som na to, ale problemom je, ze jednoduchy crawl cez cez html markup konkretneho vyjazdu na to nestaci - vtedy su cez img tagy nacitane len male thumbnails, az pri kliknuti na hocijaku z fotiek sa dynamicky nacitaju (javascript) plne verzie obrazkov.
Cize ten tool by musel vediet nielen hladat v markupe po nasmerovani na konkretny vyjazd (jednoducha vec zbuchana za par hodin max), ale aj interpretovat client-side kod (javascript) a simulovat kliknutie na niektory z obrazkov vyjazdu, to uz je zlozitejsia vec na par dni roboty a do toho sa mi uprimne nechce
Teraz mi ale napadla dalsia moznost, dal by sa jednoducho najist v markupe zdroj tych thumbnailov a podla neho zistit URI fullsize obrazkov, ulahcene je to tym, ze thumbnails aj fullsize su hostovane z toho isteho hostu (CDN-ko), maju ten isty prefix (hash) a lisia sa len suffixom, ktory je generovany podla konkretnej velkosti obrazka, teda napriklad thumbnail ma adresu:
https://dgtzuqphqg23d.cloudfront.net/eJaXboAD5Psf9OJQONqARXehdAdikS75l-jA1kee5EI-128x96.jpg
A fullsize obrazok:
https://dgtzuqphqg23d.cloudfront.net/eJaXboAD5Psf9OJQONqARXehdAdikS75l-jA1kee5EI-2048x1536.jpg
Algoritmus vytvarania thumbnailov je ten, ze obrazok sa symetricky zmensi na 1/16 velkosti fullsize obrazku, opacnym prepoctom dokazes vypocitat rozlisenie a teda aj suffix a adresu fullsize obrazku.
Ma to len jeden hacik, pokial je povodna sirka/vyska nedelitelna 16, thumbnail sirka/vyska bude zaokruhlena, priklad takeho thumbnailu:
https://dgtzuqphqg23d.cloudfront.net/BhogASnNfIrXecNDqLQtv3LynoY23MgmFclms7ujBB0-128x44.jpg
Povodny obrazok v tomto pripade nema suffix 2048x704, ale 2048x709...
Inteligentny tool by to samozrejme dokazal osefovat, v pripade nenajdeneho fullsize zdroja podla thumbnailu by spravil scan oboma smermi, worst case +-8 na sirke/vyske a vyskusal tieto suffixy. Toto znie nadejne, do toho sa pustim