Teljes sor feltöltésén még lehet gyorsítani vermes módszerrel (szerk.: ez rossz lehet akkor, amikor vannak kijáratok, de azok talán attribútumokkal is megoldhatók? Akkor viszont villogna ott a sprite):
Ezzel egy sor 0.18 helyett 0.12 ms, de még lehetne javítani egy keveset, az egyik összeadás például könnyen elkerülhető lenne ha már a rutin első hívása előtt megfelelően be lenne állítva a HL regiszter, a végén pedig a 40 helyére 72 kerülne.
Most is villog, mert az ajtós verziót elszúrtam, az ajtó helyére 0-át ír a program
, jó lesz ez a vermes megoldás, az ajtó megoldható vagy egy önmódosító kóddal, vagy lesz külön ajtós verzió, mint ahogy most is van. Biztos lehetne még gyorsítani picit a többi részen is, pl az ismétlődő pályabájtok összevonásával, de az még növelné az amúgy se kicsi pályarajzoló kódot
Az önmódosító kód szimpinek tűnt, de rájöttem, hogy 3 nop-ot kellene betenni az eredeti rutinba, meg a pozíció igazítást, így el is vetettem, külön rutin lesz rá, ami kihagyja az ajtót, és lassabb is lesz egy pöppet a HL igazítás, 4 léptetés, egy bájt írása, majd SP igazítás, és HL visszaállítás miatt.