Narzędzia użytkownika

Narzędzia witryny


podrecznik:wynik_badania:jak_czytac_wynik_badania

Jak interpretować wynik

Raport z wynikiem badania pracy dyplomowej składa się z kilku sekcji - wszystkie pola szczegółowo opisane są tutaj. Poniżej znajduje się instrukcja co w danej sekcji wyniku można wyczytać.

Analiza tekstu - podsumowanie.

Analiza tekstu służy do oceny, czy były wykonywane próby manipulacji w tekście pracy badanej w celu ukrycia plagiatu.

Liczba znaków specjalnych lub spoza języka pracy

Próby przerabiania tekstu poprzez wykorzystanie znaków specjalnych lub znaków spoza alfabetu języka pracy może lecz nie musi wpływać na wykrywanie plagiatów przez JSA, mimo to zaleca się zwracać uwagę na wartość tego parametru i przy wysokiej wartości parametru sprawdzać co to za znaki. Ocena czy dana wartość wynikowa jest wysoka należy do osoby analizującej wynik, gdyż w dużym stopniu zależy ona od specyfiki pracy badanej. Sprawdzić to można na podstronie TEKST PRACY w zakładce ANALIZA TEKSTU.

Liczba nierozpoznanych wyrazów w pracy

Zbyt wysoka wartość tego parametru w odniesieniu do ogólnej liczby wyrazów w pracy również może wskazywać na próby manipulacji w tekście. W tym przypadku również zalecana jest bardziej szczegółowa weryfikacja. Nierozpoznane wyrazy można zobaczyć w na podstronie TEKST PRACY w zakładce ANALIZA TEKSTU. Ocena, czy wartość parametru jest wysoka, leży po stronie osoby analizującej wynik.

Fragmenty innego stylu

Ten parametr może być pomocny przy ocenie czy sprawdzana praca była pisana samodzielnie. Wartość parametru wskazuje liczbę znalezionych fragmentów, dla których analiza tekstu wykazała, że ich styl różni się od głównego stylu pracy badanej.

Założeniem algorytmu sprawdzającego styl pisowni pracy jest to, że przynajmniej 70% pracy napisane jest jednym stylem. Reszta, może ale nie musi być napisana innym stylem np. cytaty z innych źródeł.

Wszystkie fragmenty napisane innym stylem niż główny zaznaczone są w tekście pracy - zobaczyć je można na podstronie TEKST PRACY w zakładce ANALIZA TEKSTU.

Rozkład długości wyrazów

Rozkład długości wyrazów jest przedstawiony na wykresie, który pokazuje pracę badaną na tle uśrednionych wartości ze wszystkich prac ORPPD. Wykres ten służy do oceny czy była podjęta próba manipulacji tekstem. Dzielenie wyrazów poprzez stosowanie mikro-spacji lub na odwrót łączenie za pomocą specjalnych czcionek może wpływać na skuteczność wykrywania plagiatów przez system, jednak przy zwykłym czytaniu te manipulacje nie są dostrzegane.

Rozkład długości wyrazów prezentuje jaką część (jaki procent) zajmują wyrazy poszczególnych długości (wyrażonej w znakach) w stosunku do ogólnej liczby wyrazów w pracy.

Znaczące różnice między uśrednionym rozkładem prac z ORPPD a rozkładem wykonanym dla pracy badanej mogą wskazywać na tego typu manipulacje. Rozkład długości wyrazów pracy badanej zazwyczaj rożni się od rozkładu uśrednionego prac z ORPPD. Różnica nie powinna wywoływać niepokoju, jeżeli wysokość rozkładów mniej więcej jest podobna i jeżeli rozkłady mają dużą część wspólną. Wątpliwości powinien budzić rozkład, który ma niewielki obszar pokrycia z rozkładem uśrednionym prac z ORPPD i/lub ma wyraźny pik przy jakichś długościach wyrazów, a rozkład uśredniony ORPPD w takich przypadkach jest zazwyczaj dość niski.

Jeżeli rozkład długości wyrazów pracy badanej budzi wątpliwości, zaleca się sprawdzenie co to za wyrazy w treści pracy w zakładce ANALIZA TEKSTU na podstronie TEKST PRACY.

Wykryte podobieństwa.

W JSA parametrem wskazującym na poziom podobieństwa pracy badanej do innych prac z ORPPD i dokumentów pochodzących z innych źródeł porównania (Internet, akty prawne) jest wskaźnik Procentowy Rozmiar Podobieństwa, w skrócie PRP.

Jak jest liczony wskaźnik PRP?

Otrzymana wartość PRP zależy od długości znalezionych fragmentów podobnych, które były brane pod uwagę przy obliczaniu wskaźnika. Innymi słowy wartość Y może być mniejsza, gdy nie będziemy uwzględniać krótkich fraz, a tym samym może być niższy wskaźnik PRP.

Jeżeli przy ocenie zapożyczeń za istotne uważa się tylko duże fragmenty, to dla osoby oceniającej istotna będzie wartość PRP obliczona dla długich fraz. Może być jednak i tak, że duża liczba krótkich zapożyczeń stanowi znaczącą część pracy, i w takim przypadku praca również nie może być uznana za samodzielną.

Żeby zaprezentować jak najlepiej obraz zapożyczeń, JSA przedstawia cztery wartości PRP, obliczając je dla zbiorów podobnych fragmentów, ze wskazaniem jaka najmniejsza długość frazy N była brana pod uwagę do obliczenia danej wartości. Poniższy rysunek przedstawia jak się tworzą zbiory do obliczenia sumy znaków z fragmentów zapożyczonych. W ustawieniach domyślnych N dla poszczególnych zbiorów przyjmuje wartości 5, 10, 20 i 40.

Pierwszy wskaźnik PRP JSA liczy dla N=5, czyli do obliczenia liczby znaków we fragmentach zapożyczonych *Y* brane są fragmenty od długości nie krótszej niż 5 wyrazów we fragmencie. Czyli frazy krótsze, z liczbą słów 4,3,2,1 nie są brane pod uwagę. Kolejny wskaźnik PRP liczony jest dla fragmentów nie krótszych niż 10 słów, czyli fragmenty o długości 5, 6, 7, 8 i 9 wyrazów, które były uwzględniane w pierwszym wskaźniku PRP, w drugim wskaźniku nie będą brane pod uwagę, tak samo jak i te krótsze od 5-wyrazowych. Kolejne dwa wskaźniki PRP są liczone analogicznie, ale z uwzględnieniem dłuższych fraz, odpowiednio zaczynając od fraz o długości 20 i więcej wyrazów dla trzeciego wskaźnika PRP oraz o długości 40 wyrazów i więcej dla wskaźnika czwartego.

Sytuacja, w której wszystkie cztery wartości PRP są takie same, oznacza, że wszystkie wykryte fragmenty są dłuższe niż 40 wyrazów, czyli we wszystkich czterech przypadkach jest to ten sam zbiór fragmentów. Jeżeli, na przykład, znaleziono siedem fragmentów i najkrótszy znaleziony fragment zawiera 30 wyrazów, a pozostałe sześć więcej niż 40 wyrazów, to pierwsze trzy wskaźniki PRP będą mieć tę samą wartość, a czwarty wskaźnik PRP będzie mieć wartość mniejszą, gdyż fragment o długości 30 wyrazów nie będzie brany pod uwagę. Wskaźniki PRP o tej samej wartości PRP mogą być przedstawione w różnych kolorach - kolor wskazuje na różny próg tolerancji wyniku (więcej o tym w dalszej części).

JSA umożliwia zmianę ustawień domyślnych parametrów. Mając odpowiednie uprawnienia można wykonać własne ustawienia dla poszczególnych jednostek danej instytucji (o możliwości zmiany ustawień czytaj więcej w rozdziale Ustawienia).

Pierwsze cztery wartości PRP przedstawione w wyniku stanowią wynik ogólny, uwzględniają one podobieństwa znalezione we wszystkich bazach porównawczych. Długość najkrótszej frazy, jaka była brana do obliczenia PRP jest wskazywana obok wartości PRP. Pod wartością PRP podana jest również liczba wykrytych podobnych fraz, które były uwzględniane przy obliczaniu danej wartości PRP.

Pod wynikiem ogólnym przedstawione są wyniki PRP obliczone dla znalezionych fragmentów w poszczególnych bazach porównania. Obliczane są również cztery wartości PRP, jak dla wyniku ogólnego.

Po rozwinięciu belki z nazwą bazy pokazuje się lista dokumentów (źródeł), w których zostały znalezione podobne fragmenty tekstu. Przy każdym źródle pokazana jest długość (w znakach) najdłuższego podobnego fragmentu oraz liczba fraz dla każdego obliczonego PRP pochodzących z tego źródła.

Co oznacza kolor wartości PRP?

JSA prezentuje wartości PRP w trzech kolorach: zielony, pomarańczowy i czerwony.

Kolor zielony oznacza, że skala podobieństwa nie przekracza poziomu tolerancji.

Kolor pomarańczowy oznacza, że poziom tolerancji został przekroczony - wartość PRP jest podwyższona, zalecane jest sprawdzenie danych szczegółowych wyniku w TREŚCI PRACY.

Kolor czerwony oznacza, że poziom tolerancji oraz poziom ostrzegawczy (podwyższonej tolerancji) zostały przekroczone - wartość PRP jest wysoka, niezbędne jest sprawdzenie danych szczegółowych wyniku w TREŚCI PRACY.

Zakłada się, że poziomy tolerancji są ustawiane w ramach instytucji dla całej instytucji lub dla poszczególnych jednostek według indywidualnych preferencji tych jednostek i odzwierciedla regulacje wewnętrzne uczelni.

JSA ma również ustawienia domyślne. Przedstawiają one jedynie umowny podział - nie stanowią żadnych norm odniesienia i nie są regulowane ustawowo.

/var/www/html/dokuwiki/data/pages/podrecznik/wynik_badania/jak_czytac_wynik_badania.txt · ostatnio zmienione: 2018/07/23 07:50 przez mwartacz