230 likes | 376 Vues
Wykład 6: Przetwarzanie projektów lokalizacyjnych. dr inż. Agenor Hofmann-Delbor. Plan wykładu. Wyodrębnianie materiału do tłumaczenia Transmisja danych, weryfikacja projektu Przygotowanie projektu Analiza projektu i jej przetwarzanie Tłumaczenie automatyczne
E N D
Wykład 6: Przetwarzanie projektów lokalizacyjnych dr inż. Agenor Hofmann-Delbor
Plan wykładu • Wyodrębnianie materiału do tłumaczenia • Transmisja danych, weryfikacja projektu • Przygotowanie projektu • Analiza projektu i jej przetwarzanie • Tłumaczenie automatyczne • Zarządzanie podzielonym materiałem • Konsolidacja materiału i jego weryfikacja • Testy QA, dostarczenie materiału zleceniodawcy
Przygotowanie do lokalizacji • Po podjęciu decyzji o lokalizacji następują kolejne etapy: • Wyodrębnienie materiału • Analiza materiału w oparciu o istniejące pamięci tłumaczeń • Przygotowanie do lokalizacji nie obejmuje jednak tylko fizycznego przygotowania plików. Wymagane jest także: • - Ustalenie terminologii • - Ustalenie osoby odpowiedzialnej za rozstrzyganie wątpliwości językowych • - Zapewnienie dostępu do nowych buildów aplikacji • - Wybór optymalnej technologii lokalizacyjnej (oprogramowanie, standardy etc.)
Wyodrębnianie materiału do lokalizacji • Istnieje wiele możliwości wyodrębniania materiału do lokalizacji, w zależności od formatu danych. Najczęściej mamy do czynienia z następującymi sytuacjami: • Plik PDF. Optymalnym sposobem jest uzyskanie źródła dokumentu: z reguły pliki w formatach Quark, InDesign lub FrameMaker, okazjonalnie doc. W skrajnym przypadku wykonuje się konwersję pdf -> doc ze wszelkimi jej konsekwencjami • Pliki UI – wybór zasobów do lokalizacji. Określenie, które moduły i biblioteki zostały zaktualizowane. Wybór określonych elementów. Przygotowanie metodyki lokalizacji / aktualizacji kolejnych wersji – w trakcie trwania procesu lokalizacji z całą pewnością będą generowane kolejne wersje buildu • Dokumentacja – wybór zbioru dokumentów (x)html lub chm, zrzut listy plików z systemu CMS.
Wyodrębnianie materiału do lokalizacji – c.d. Wybór technologii i standardów Eksport z CMS
Transmisja danych, weryfikacja poprawności plików Okazjonalnie stosowane są systemy z własnymi protokołami transmisji lub specjalne aplikacje do transmisji danych między serwerami np. Microsoft Rainbow. Ich użycie było często konsekwencją prędkości transmisji, która była dostępna kilka lat temu – niezbędne było utrzymanie transmisji także w nocy przy zachowaniu szyfrowania danych. Duże projekty lokalizacyjne były przesyłane kilkanaście godzin. Obecnie najczęściej stosuje się serwery FTP lub sFTP, bądź transmisję z wykorzystaniem protokołu SCP. Kluczowe są trzy kryteria: Prędkość transmisji, bezpieczeństwo oraz poprawność danych. Dane najczęściej kompresowane są do archiwum zip (z plikiem CRC). Dopiero po dotarciu do celu pliki są wyodrębniane i następuje porównanie zawartości archiwum z deklarowaną listą plików (liczba, wielkość w kb itp.)
Przygotowanie projektu do realizacji – c.d. Przykład zablokowania części tekstu do edycji stylem TW4WinExternal Tekst możliwy do edycji, wychwytywany przez funkcję analizy dokumentu
Przygotowanie projektu do realizacji Po wyodrębnieniu plików należy poczynić szereg czynności, które umożliwią realizację projektu. Na tym etapie nie jest jeszcze możliwe bezpieczne rozpoczęcie pracy. Część narzędzi wymaga przetworzenia przesłanych plików, by rozpocząć tłumaczenie lub nawet analizę. Pierwszym etapem będzie zatem zapewnienie możliwości lokalizacji określonego formatu. Gdy nie jest możliwa lokalizacja danego formatu pliku, zwykle realizuje się ją przez format pośredni (najczęściej tekstowy oparty na XML). Po zakończeniu tłumaczenia wykonywana jest konwersja zwrotna do formatu źródłowego. Upewniwszy się, iż materiał jest możliwy do edycji, wykonywana jest analiza projektu. Analiza zawsze odnosi się do konkretnej pamięci tłumaczeń, kluczowe jest zatem wybranie właściwej bazy, a także określenie reguł segmentacji, minimalnego progu zgodności i punktów karnych
Analiza projektu i jej przetwarzanie Analiza wykonywana jest z zachowaniem wybranych dla danej pamięci tłumaczeń reguł segmentacji oraz punktów karnych. Jej wyniki zapisywane są w postaci pliku raportu, który może być podstawą tzw. szczegółowych arkuszy trackingowych. Analiza dotyczy zwykle całości materiału, klient końcowy najczęściej nie ma wglądu w liczbę tłumaczy zaangażowanych w projekt - traktowany jest jako całość. Analiza pozwala raz jeszcze potwierdzić wielkość plików (od strony liczby słów) oraz ich liczbę w projekcie. Należy pamiętać, że powtórzenia w obrębie całości projektu najczęściej różnią się od realnej ich liczby w dowolnym wybranym jego fragmencie. Z tego względu analiza wykonywana jest osobno na każdej „paczce” wybranej z projektu. Wyniki analizy z jej rozbiciem na poszczególne pliki są umieszczane w specjalnym arkuszu lub systemie śledzenia projektu.
Tłumaczenie automatyczne Kolejnym etapem po przygotowaniu analizy projektu jest wykonanie automatycznego tłumaczenia całości materiału. Ma ono na celu wstawienie wszystkich segmentów o 100% zgodności do dokumentów, aby zmniejszyć nakład pracy tłumaczy oraz aby rozróżnić segmenty pierwotnie umieszczone w bazie od tych, które zostały utworzone w trakcie pracy nad projektem (na przykład na podstawie koloru). Tłumaczenie automatyczne możliwe jest także dla segmentów o częściowej zgodności, ale stosowane jest niezmiernie rzadko. W ramach tłumaczenia automatycznego możliwe jest także umieszczenie terminologii w segmentach pochodzących z pretranslacji (tłumaczenia automatycznego wykonywanego przed rozpoczęciem rzeczywistego tłumaczenia) Tłumacz zwykle pomija segmenty 100%, ale możliwa jest także ich weryfikacja na etapie tłumaczenia
Zarządzanie podzielonym materiałem Postępy prac nad projektem zwykle wizualizowane i śledzone są w dwóch kategoriach: na poziomie pliku – systemy bądź arkusze wskazujące, który plik przynależy do której paczki wraz z jego pełną ścieżką, miejscem w strukturze projektu itp. na poziomie paczki - jednoznacznie identyfikowalny w systemie zbiór plików o określonej nazwie. Z reguły materiał logicznie pogrupowany np. na podstawie modułu bądź struktury. Na tym poziomie śledzenie wizualizuje termin przydzielenia danej paczki konkretnej osoby, otrzymanie materiału, czas pracy. Pozwala to reagować na wszelkie przesunięcia planu widocznego na wykresie Gantt’a
Konsolidacja i weryfikacja podzielonego materiału Dzieląc materiał na paczki powodujemy powstanie dodatkowych kroków w projekcie związanych z konsolidacją i weryfikacją podzielonego materiału. Ogólna zasada jest prosta – po konsolidacji materiału z paczek liczba plików i ich struktura powinna odpowiadać materiałowi sprzed podziału. Weryfikacja może odbywać się na poziomie paczek lub po ich skonsolidowaniu w jedną, całościową strukturę. Weryfikacja na poziomie paczek zapewnia większe bezpieczeństwo projektu, gdyż etap konsolidacji końcowej z reguły jest jednym z ostatnich etapów przetwarzania projektu i nie umożliwia odpowiedniego reagowania na sytuacje „zniknięcia” plików. Oprócz weryfikacji na poziomie struktury projektu, konieczna jest także weryfikacja na poziomie konkretnych plików.
Testy QA Testy na poziomie konkretnych plików to kluczowy etap przygotowania projektu do dostarczenia klientowi. Testy te mają charakter: Językowy – na przykład analizowane jest użycie „zabronionych” słów lub istnienie wykrywalnych literówek, niespójności Techniczny – analizowane są błędy związane ze znakami przestankowymi, kodowaniem znaków, tagami Testy te są najczęściej realizowane przez inżynierów lokalizacji i korektorów/specjalistów językowych. Powoli jednak zasadą staje się także ich wykonywanie już na etapie tłumaczenia dokumentu przez tłumaczy indywidualnych.
Dostarczanie materiału do zleceniodawcy Podobnie jak przy odbieraniu materiału kluczowe jest zapewnienie terminowej i bezpiecznej wysyłki plików. W większości przypadków projektu dostarczane są w formie elektronicznej za pomocą jednej z popularnych metod przesyłania plików. Jeszcze przed przesłaniem materiału konieczne jest upewnienie się, że struktura archiwum odpowiada dokładnie otrzymanemu pierwotnie projektowi a wszystkie pliki przygotowane są w ostatecznej wersji (w trakcie trwania projektu może pojawiać się nawet 8 wersji plików).
Inne kroki w cyklu projektowym • Tłumaczenie maszynowe…. • Część narzędzi umożliwia wstawienie do dokumentów tekstu pochodzącego z tłumaczenia maszynowego. Najczęściej wykonuje się najpierw takie tłumaczenie, a następnie nadpisuje się segmenty wszystkimi pochodzącymi z „rzeczywistej” pamięci tłumaczeń. W ten sposób tłumacz otrzymuje więcej podpowiedzi niż przy klasycznym sposobie lokalizacji projektów, nawet jeśli tylko niewielki odsetek segmentów z tłumaczenia maszynowego nadaje się do modyfikacji/użycia. • Odnośniki do niezlokalizowanych plików • Pliki projektów pomocy wielu producentów zawierają z reguły liczne odnośniki do innych plików. Jednym ze stosowanych kroków przy przetwarzaniu projektów jest identyfikacja, czy plik do którego wskazuje łącze jest zlokalizowany. Możliwe jest dodanie dodatkowej frazy, np. In English lub usunięcie odnośnika, w zależności od decyzji producenta/językoznawcy
Sytuacje awaryjne Każdy projekt lokalizacyjny narażony jest na liczne niespodziewane sytuacje, które z reguły powodują mniejsze lub większe utrudnienia w jego realizacji. Można podzielić je na kilka kategorii: Problemy techniczne Na przykład: kodowanie znaków, działanie narzędzi, struktura plików, złe przygotowanie Problemy związane z terminem prac Na przykład: choroba, przesunięcia projektowe, urlopy, nagłe skrócenie terminu projektu Inne losowe wypadki – awaria systemów, Internet, backup, wszelkie możliwe wystąpienia „praw Murphyego”.
Akceptacja projektu po stronie zleceniodawcy Otrzymanie materiału od podwykonawcy nie oznacza końca procesu. Również jego poprawne wyodrębnienie i porównanie liczby plików i ich struktury nie jest końcem testów i nie oznacza jeszcze akceptacji projektu. Po otrzymaniu projektu firma wykonuje wewnętrzne testy techniczne i językowe, które lokalizowany projekt musi przejść, aby zakończyć się sukcesem. Podwykonawca z reguły niezwłocznie stara się wprowadzać wszelkie znalezione uchybienia, ale idealną i pożądaną sytuacją jest dostarczenie projektu, który od razu spełnia wszelkie wymogi klienta. Projekt przechodzi szczegółową analizę językową, tzw. Linguistic review. Lista uwag wraca do firmy, która wykonała lokalizację. Należy zauważyć, że część błędów nie musi wynikać z winy firmy lokalizującej projekt i stąd uwagi te są komentowane przez specjalistów językowej firmy przez ich implementacją. Testy językowe i ogólna ocena są najczęściej wyrażane procentowo. Bardzo dobrze wykonane projekty lokalizacyjne uzyskują noty powyżej 90%.
Aktualizacje Większość projektów lokalizacyjnych cechuje się dużą powtarzalnością. Wynika to z faktu, iż producenci co kilka lat aktualizują swoje produkty, bądź wprowadzają ulepszenia, które w mniejszym lub większym stopniu bazują na dotychczasowych technologiach. W przypadku niektórych grup językowych (do których należy j. polski) nie jest powiedziane, że każda aktualizacja będzie wymagała lokalizacji. Zakładając jednak, iż decyzja zapadnie realizowany jest podobny proces. Różnica polega na tym, iż analiza odbywa się w odniesieniu do już nasyconej pamięci tłumaczeń, przez co projekt powinien być zrealizowany szybciej i taniej. Dochodzi do tego możliwość tłumaczenia kontekstowego. Mając starszą wersję plików oraz pamięć tłumaczeń możliwe jest zablokowanie części segmentów i ich bezpieczne przetłumaczenie kontekstowe (sprawdzane są sąsiadujące segmenty oraz pamięć tłumaczeń). W ten sposób całe fragmenty plików mogą w ogóle nie być częścią nowego projektu lokalizacyjnego
Backup… Zapewnienie poprawnego backupu w obrębie projektu nie sprowadza się do jednego elementu przepływu danych. W trakcie przetwarzania projektu powstaje przynajmniej 8 różnych wersji plików. Backup nie tylko zabezpiecza przed utratą danych, ale także umożliwia powrót do poprzedniej wersji pliku w razie pomyłki. Może być to realizowane przez system wersjonowania CVS lub poprzez klasyczną strukturę z folderami i backupowaniem zawartości dysków sieciowych. Backup musi także dotyczyć pamięci tłumaczeń – często odzyskanie ich zawartości oznaczałoby odnalezienie plików z kilku lat działalności. Zalecane jest także, aby tłumacze pracowali na zdalnych pamięciach, wówczas znika problem backupu lokalnej, plikowej pamięci tłumaczeń
Więcej informacji, odnośniki http://pl.wikipedia.org/wiki/Proces_wytw%C3%B3rczy_oprogramowania http://pl.wikipedia.org/wiki/Backup http://pl.wikipedia.org/wiki/Archiwizacja http://pl.wikipedia.org/wiki/Transmisja http://pl.wikipedia.org/wiki/Testowanie_oprogramowania http://pl.wikipedia.org/wiki/Weryfikacja
Pytania, kontakt agenorh@zpsb.szczecin.pl