Narzędzia użytkownika

Narzędzia witryny


podrecznik:wynik_badania:jak_czytac_wynik_badania

Jak interpretować wynik

Raport z wynikiem badania pracy dyplomowej składa się z kilku sekcji - wszystkie pola szczegółowo opisane są tutaj.

Podstawowe dane wynikowe badania są przedstawione w trzech sekcjach, opisanych poniżej. Dane szczegółowe dotyczące informacji podstawowych są pokazywane w treści pracy na podstronie TREŚĆ PRACY

Analiza tekstu - podsumowanie.

Analiza tekstu służy pomocą do oceny, czy były wykonywane jakieś manipulacje z tekstem pracy badanej w celu ukrycia plagiatu przed detektorem JSA.

Liczba znaków specjalnych lub z poza języka pracy

Manipulacja z tekstem poprzez wykorzystanie znaków specjalny lub znaków z poza alfabetu języka pracy może lecz nie musi wpływać na wykrywanie plagiatów przez JSA, mimo to zaleca się zwracać uwagę na wartość tego parametru i przy wysokiej wartości parametru sprawdzać co to za znaki w tekście pracy. Ocena czy dana wartość wynikowa jest wysoka należy do osoby analizującej wynik, gdyż w dużym stopniu zależy ona od specyfiki pracy badanej. Sprawdzić to można na podstronie TEKST PRACY w zakładkę ANALIZA TEKSTU.

Liczba nierozpoznanych wyrazów w pracy

Zbyt wysoka wartość tego parametru w odniesieniu do ogólnej Liczby wyrazów w pracy również może wskazywać na manipulacje z tekstem. W tym przypadku również zalecana jest bardziej szczegółowa weryfikacja. Nierozpoznane wyrazy można zobaczyć w na podstronie TEKST PRACY w zakładkę ANALIZA TEKSTU. Ocena, czy wartość parametru jest wysoka, leży po stronie analizującego wynik.

Liczba stylów pisowni

Ten parametr może być pomocny przy ocenie czy ocenie czy sprawdzana praca była pisana samodzielnie. Wartość parametru wskazuje liczbę znalezionych fragmentów, dla których analiza tekstu wykazała, że ich styl różni się od podstawowego stylu pracy badanej.

Zakłada się, że podstawowy styl pracy badanej stanowi 70% tekstu pracy. Jeżeli całą praca napisana w jednym stylu, wskaźnik ten jest równy 1. Jeżeli w tekście wykryto fragmenty z innym stylem, wartość wskaźnika będzie większa niż 1.Wartość wskaźnika pomniejszona o 1 wskazuje na liczbę fragmentów z odmiennym stylem.

Wykrycie fragmentu z innym stylem może lecz nie musi wskazywać, że ten fragment był napisany inną osobą, gdyż znaleziony fragment może być tylko cytatem. Dlatego, gdy wskaźnik jest większy niż 1, nie należy od razu zakładać, że praca nie jest napisana samodzielnie. W tym przypadku rekomenduje się sprawdzenie w treści pracy co to za fragmenty. Zobaczyć je można na podstronie TEKST PRACY w zakładce ANALIZA TEKSTU.

Rozkład długości wyrazów

Rozkład długości wyrazów jest przedstawiony w jako histogram pracy badanej na tle histogramu z uśrednionym rozkładem otrzymanym z analizy wszystkich prac ORPPD. Histogram również służy do oceny czy była jakaś manipulacja z tekstem. Dzielenie wyrazów poprzez stosowanie mikro-spacji lub na odwrót łączenie za pomocą specjalnych czcionek może wpływać na skuteczność wykrywania plagiatów przez system, jednak przy zwykłym czytaniu te manipulacje nie są dostrzegane.

Rozkład długości wyrazów prezentuje jaką część (jaki procent) zajmują wyrazy poszczególnych długości (wyrażonej w znakach) w stosunku do ogólnej liczby wyrazów w pracy.

Znaczące różnice między uśrednionym rozkładem z ORPPD a rozkładem wykonanym dla pracy badanej mogą wskazywać na tego typu manipulacje. Rozkład długości wyrazów pracy badanej zazwyczaj rożni się od rozkładu uśrednionego ORPPD. Różnica nie powinna wywoływać niepokój, jeżeli wysokość rozkładów mniej-więcej jest podobna i mają dużą część wspólną. Wątpliwości powinien budzić rozkład, który ma niewielki obszar pokrycia z rozkładem uśrednionym ORPPD i/lub ma wyraźny pik przy jakichś długościach wyrazów, a rozkład uśredniony ORPPD przy tym jest dość niski.

Jeżeli rozkład długości wyrazów pracy badanej budzi wątpliwości, to zaleca się sprawdzenie co to za wyrazy w treści pracy w zakładce ANALIZA TEKSTU na podstronie TEKST PRACY.

Wykryte podobieństwa.

W JSA parametrem wskazującym na poziom podobieństwa pracy badanej do innych prac ORPPD i dokumentów pochodzących z innych źródeł porównania (Internet, akty prawne) jest wskaźnik Procentowy Rozmiar Podobieństwa, w skrócie PRP.

Jak jest liczony wskaźnik PRP?

Otrzymana wartość PRP zależy od długości znalezionych fragmentów podobnych, które były brane pod uwagę przy obliczaniu wskaźnika. Innymi słowy wartość Y może być mniejsza, gdy nie będziemy uwzględniać krótkich fraz, a tym samym może być mniejszy wskaźnik PRP.

Jeżeli przy ocenie zapożyczeń za istotne uważa się tylko duże fragmenty, to dla osoby oceniającej będzie istotna wartość PRP obliczona dla długich fraz. Jednak może być i tak, że duża ilość krótkich zapożyczeń stanowi znaczącą część pracy, i w takim przypadku praca również nie może być uznana za samodzielną.

Żeby zaprezentować jak najlepiej obraz zapożyczeń, JSA przedstawia 4 wartości PRP, obliczając je dla zbiorów podobnych fragmentów, ze wskazaniem jaka najmniejsza długość frazy N była brana pod uwagę do obliczenia danej wartości. Poniższy rysunek przedstawia jak się tworzą zbiory do obliczenia sumy znaków z fragmentów zapożyczonych. JSA oblicza 4 wartości PRP. W ustawieniach domyślnych N dla poszczególnych zbiorów przyjmuje wartości 5, 10, 20 i 40.

JSA umożliwia również zmienić te ustawienia, wybierając inną długość N dla uwzględnianych fraz w obliczeniach PRP. Ustawienia można wykonać dla poszczególnych jednostek instytucji lub dla całej instytucji. (O możliwości zmiany ustawień czytaj więcej w rozdziale Ustawienia) Pierwsze 4 wartości PRP przedstawione w wyniku, wynik ogólny, uwzględniają podobieństwa znalezione we wszystkich bazach porównawczych. Długość najkrótszej frazy, jaka była brana do obliczenia PRP jest wskazywana obok wartości PRP. Pod wartością PRP również podaje się liczba wykrytych podobnych fraz, znaki których byli liczone przy obliczaniu danej wartości PRP.

Pod wynikiem ogólnym przedstawione są wyniki PRP obliczone dla poszczególnych baz porównania, po 4 wartości, jak dla wyniku ogólnego.

Po rozwinięciu belki z nazwą bazy pokazuje się lista dokumentów (źródeł) w których zostały znalezione podobne fragmenty tekstu. przy każdym źródle pokazana jest długość (w znakach) najdłuższego podobnego fragmentu oraz liczba fraz dla każdego obliczonego PRP, pochodzących z tego źródła.

Co oznacza kolor wartości PRP?

JSA prezentuje wartości PRP w trzech kolorach: zielony, pomarańczowy i czerwony.

Kolor zielony oznacza, że rozmiar podobieństwa nie przekracza poziomu tolerancji

Kolor pomarańczowy oznacza, że poziom tolerancji został przekroczony - wartość PRP jest podwyższona, zalecane jest sprawdzenie danych szczegółowych wyniku w TREŚCI PRACY.

Kolor czerwony oznacza, że poziom tolerancji oraz poziom ostrzegawczy (podwyższonej tolerancji) zostali przekroczone - wartość PRP jest wysoka, niezbędne jest sprawdzenie danych szczegółowych wyniku w TREŚCI PRACY.

Zakłada się, że poziomy tolerancji są ustawiane w ramach instytucji dla całej instytucji lub dla poszczególnych jednostek według indywidualnych preferencji tych jednostek i prezentuję regulacje wewnętrzne uczelni.

JSA ma również ustawienia domyślne. Przedstawiają one jedynie umowny podział - nie stanowią żadnych norm odniesienia i nie są regulowane ustawowo.

/var/www/html/dokuwiki/data/pages/podrecznik/wynik_badania/jak_czytac_wynik_badania.txt · ostatnio zmienione: 2018/06/20 14:11 przez eniemirska