Šta je .DOCX i po čemu se razlikuje od .DOC?
Microsoft Word je većini poznat alat za obradu teksta koji postoji više od 30 godina. Kada čuvamo dokumente kreirane u ovom alatu obično biramo .doc ili .docx ekstenziju, ali koja je razlika?
MS Word je nastao, kao što sam pomenuo, pre više od 30 godina u MS-DOS operativnom sistemu i tada je .doc bio primarni format čuvanja (izvoza) fajlova. Sve do 2006. godine, .doc format je mogao da čita, uređuje i izvozi jedino Word. Nakon te godine, Microsoft je otvorio specifikacije i format je prošao kroz „obrnuti inženjering“, tj. Reverse engineering. Tada su programeri mogli da kreiraju svoje softvere koji će čitati i obrađivati .doc fajlove. Ipak, i pre toga, krajem devedesetih su se pojavili softveri koji su mogli da rade sa .doc fajlovima ali, naravno, nisu uspeli da čitaju i obrađuju sve delove tih dokumenata. Time je MS držao dominaciju nad tržištem.
Nakon pritiska konkurentnog softvera otvorenog koda (open-source) Open Office i njegovog formata Open Document Format (ODF), MS je morao da prisvoji još otvoreniji i dostupniji standard. U toku razvoja DOCX formata, nastali su i formati XLSX za tabele i PPTX za prezentacije.
Standard je predstavljen pod nazivom „Office Open XML“ budući da je format baziran na Extensible Markup Language strukturi umesto na binarno, na čemu je bio baziran DOC. Time su fajlovi čuvani u DOCX formatu postali manji, smanjena je verovatnoća za greškom i kompresovane slike su dobile na kvalitetu.
Već sam pisao članak o tome kako da „izvučete“ sve slike iz DOCX fajlova i tu možete lepo videti kako izgleda struktura jednog takvog fajla:
XML baziran DOCX je postao podrazumevani format za čuvanje dokumenata u računar od 2007. verzije softvera pa na dalje. Mnogi misle da MS Word 2003. ne može da čita DOCX i da je cela ta priča oko prelaska na novi format zapravo samo plan kompanije Microsoft kako bi zaradili na prodaji novih softvera – to nije tačno. MS Word 2003. može da čita XML bazirane Word fajlove, MS je ažurirao sve verzije tako da mogu da obrađuju i novi format fajlova.
Ipak, neki korisnici još uvek izvoze fajlove u DOC formatu u strahu da neki stariji računar sa starijim Office paketom neće moći da pročita fajl. To je donekle i razumno obzirom da postoje korisnici koji nisu ažurirali starije Word verzije (čitaj: piratske verzije) i ne podržavaju u potpunosti DOCX format. Takođe, i neki noviji alati za obradu teksta, poput Google Docs, ne čitaju kako treba DOC formate.
Zaključak je: najbolje je sačuvati i DOC i DOCX pa kada vam šta zatreba, barem sada, barem u Srbiji. Jer nemaju svi najnovije plaćene softvere i mnogi ni ne mogu, a ni ne znaju, da ažuriraju Word tako da podržava i DOCX format.