Narzędzia użytkownika

Narzędzia witryny


podrecznik:wynik_badania:jak_czytac_wynik_badania

Jak interpretować wynik

Raport z wynikiem badania pracy dyplomowej składa się z kilku sekcji. Opis elementów strony wyniku znajduje się tutaj, natomiast poniżej znajdą Państwo szczegółowy opis poszczególnych sekcji.

Analiza tekstu

Sekcja ta służy pomocą przy ocenie, czy na tekście badanej pracy zostały wykonywane potencjalne manipulacje mające na celu ukrycie plagiatu.

Znaki specjalne lub spoza języka pracy

Wpływ na ten parament mogą mieć (lecz nie muszą) próby modyfikacji tekstu poprzez wykorzystanie znaków specjalnych lub znaków spoza alfabetu języka pracy, dlatego też zaleca się zwrócenie uwagę na jego wartość, zaś przy wysokim wskaźniku sprawdzenie wyszczególnionych znaków w widoku Tekst pracy (panel menu bocznego) w zakładce Analiza tekstu. Ostateczna ocena czy wskazane znaki świadczą o próbie manipulacji tekstem należy do osoby analizującej wynik oraz zależy od specyfiki badanej pracy.

Nierozpoznane wyrazy

Zbyt wysoka wartość tego parametru w odniesieniu do ogólnej liczby wyrazów w pracy może wskazywać na próby manipulacji tekstem poprzez zmiany niewidoczne dla czytającego pracę. W tym przypadku również zalecana jest bardziej szczegółowa weryfikacja. Nierozpoznane wyrazy można zobaczyć w widoku Tekst pracy (panel menu bocznego) w zakładce Analiza tekstu. Ostateczna ocena czy wskazane wyrazy świadczą o próbie manipulacji tekstem należy do osoby analizującej wynik.

Liczba fragmentów innego stylu

Wartość parametru wskazuje liczbę znalezionych fragmentów, dla których analiza tekstu wykazała, że ich styl różni się od głównego stylu pracy badanej. Założeniem algorytmu sprawdzającego styl pisania pracy jest to, że przynajmniej 70% pracy napisane jest jednym stylem. Uwzględnione w tej sekcji fragmenty mogą (lecz nie muszą) być zarówno zapożyczeniami z innych tekstów jak i cytatami z innych źródeł. Wszystkie fragmenty napisane innym stylem zaznaczone są w tekście pracy – można je zobaczyć w widoku Tekst pracy (panel menu bocznego) w zakładce Analiza tekstu. Ostateczna ocena wpływu tego parametru na akceptację badanej pracy należy do osoby analizującej wynik.

Rozkład długości wyrazów (wykres)

Rozkład długości wyrazów jest przedstawiony na wykresie, który pokazuje długość wyrazów w pracy badanej (kolor fioletowy) na tle uśrednionych wartości ze wszystkich prac znajdujących się w bazie ORPPD (kolor szary). Wykres ten służy do oceny czy była podjęta próba manipulacji tekstem. Dzielenie wyrazów poprzez stosowanie mikrospacji lub łączenie wyrazów za pomocą specjalnych czcionek może wpływać na długość wyrazów uwidocznioną na wykresie, zaś przy zwykłym czytaniu te manipulacje nie są dostrzegane. Wykres ten prezentuje jaką część (procent) badanej pracy zajmują wyrazy poszczególnych długości (wyrażonej w liczbie znaków) w stosunku do ogólnej liczby wyrazów w pracy. Znaczące różnice między uśrednionym rozkładem prac z ORPPD a rozkładem wykonanym dla pracy badanej mogą wskazywać na zastosowanie manipulacji. Rozkład długości wyrazów pracy badanej zazwyczaj rożni się od rozkładu uśrednionego prac z ORPPD. Jeżeli wysokość rozkładów mniej więcej jest podobna, a rozkłady mają dużą część wspólną, to różnice nie powinny niepokoić. Należy jednak zwrócić uwagę na sytuację, kiedy występuje niewielki obszar pokrycia rozkładów lub wyraźny szczyt (pik) przy niektórych długościach wyrazów, podczas gdy rozkład dla ORPPD jest wyraźnie niższy. Wzbudzające wątpliwości długości wyrazów można zobaczyć w widoku Tekst pracy (panel menu bocznego) w zakładce Analiza tekstu. Ostateczna ocena czy wskazane długości wyrazów świadczą o próbie manipulacji tekstem należy do osoby analizującej wynik.

Wyniki ogólne

W JSA parametrem wskazującym na poziom podobieństwa pracy badanej do innych prac z ORPPD i dokumentów pochodzących z innych źródeł porównania (Internet, akty prawne, uczelniane bazy referencyjne) jest wskaźnik o nazwie Procentowy Rozmiar Podobieństwa (w skrócie PRP).

Jak jest liczony wskaźnik PRP?

Otrzymana wartość PRP zależy od długości znalezionych podobnych fragmentów, które były brane pod uwagę przy obliczaniu wskaźnika. Innymi słowy wartość Y może być mniejsza, gdy nie będziemy uwzględniać krótkich fraz, a tym samym wskaźnik PRP może być niższy.

Jeżeli przy ocenie zapożyczeń za istotne uważa się tylko duże fragmenty, to dla osoby oceniającej istotna będzie wartość PRP obliczona dla długich fraz. Jednocześnie, kiedy duża liczba krótkich zapożyczeń stanowi znaczącą część pracy, również nie może być ona uznana za samodzielną.

W celu zaprezentowania jak najlepszego obrazu zapożyczeń, JSA przedstawia aż cztery wartości PRP, obliczając je dla zbiorów podobnych fragmentów, ze wskazaniem jaka najmniejsza długość frazy N była brana pod uwagę do obliczenia danej wartości. Poniższy rysunek przedstawia jak tworzą się zbiory do obliczenia sumy znaków z fragmentów zapożyczonych. W ustawieniach domyślnych N dla poszczególnych zbiorów przyjmuje wartości 5, 10, 20 i 40.

Pierwszy wskaźnik PRP system liczy dla N=5: to znaczy, że do obliczenia liczby znaków we fragmentach zapożyczonych Y5 liczone są fragmenty od długości nie krótszej niż 5 wyrazów we fragmencie (frazy krótsze – czterowyrazowe i mniej - nie są brane pod uwagę). Kolejny wskaźnik PRP Y10 liczony jest dla fragmentów nie krótszych niż 10 słów (fragmenty dziewięciowyrazowe i mniej – również takie, które były uwzględniane w Y5 - nie będą brane pod uwagę). Kolejne dwa wskaźniki PRP są liczone analogicznie do wyżej opisanych, odpowiednio z uwzględnieniem długości fraz co najmniej 20 (dla Y20) i 40 (dla Y40) wyrazów.

Sytuacja, w której wszystkie cztery wartości PRP są takie same, oznacza, że wszystkie wykryte fragmenty są dłuższe niż 40 wyrazów, czyli we wszystkich czterech przypadkach jest to ten sam zbiór fragmentów. Dla przykładu: znaleziono siedem fragmentów, z których najkrótszy znaleziony fragment zawiera 30 wyrazów, a pozostałe sześć więcej niż 40 wyrazów. Oznacza to, że wskaźniki PRP Y5, Y10, Y20 będą mieć taką samą wartość, zaś wskaźnik Y40 będzie mieć mniejszą wartość, gdyż fragment o długości 30 wyrazów nie będzie brany pod uwagę. Wskaźniki PRP o niższych wartościach będą miały inne kolory, jednocześnie wskaźnik wiodący (wybrany przez Administratora JSA) będzie podświetlony na Raporcie. Przy odpowiednich uprawnieniach JSA umożliwia modyfikację ustawień domyślnych wskaźników Y zgodnie z potrzebami i charakterystyką prac dyplomowych sprawdzanych w kontekście danej jednostki (o możliwości zmiany ustawień więcej w rozdziale Ustawienia).

Referencyjne bazy porównawcze

Pod wynikiem ogólnym przedstawione są wyniki PRP obliczone dla znalezionych fragmentów w poszczególnych bazach porównania. Obliczane są również cztery wartości PRP, jak dla wyniku ogólnego.

Po rozwinięciu belki z nazwą bazy pokazuje się lista źródeł prawdopodobnych zapożyczeń, w których zostały znalezione podobne fragmenty tekstu. Przy każdym źródle pokazana jest długość (w znakach) najdłuższego podobnego fragmentu oraz liczba fraz dla każdego obliczonego PRP pochodzących z tego źródła.

Co oznacza kolor wartości PRP?

JSA prezentuje wartości PRP w trzech kolorach: zielony, pomarańczowy i czerwony, które korespondują z ustawionym poziomem tolerancji każdego wskaźnika.

Kolor zielony oznacza, że skala podobieństwa nie przekracza poziomu tolerancji.

Kolor pomarańczowy oznacza, że poziom tolerancji został przekroczony - wartość PRP jest podwyższona i zalecane jest sprawdzenie danych szczegółowych wyników w treści pracy.

Kolor czerwony oznacza, że poziom tolerancji oraz ostrzegawczy poziom podwyższonej tolerancji zostały przekroczone, wartość PRP jest wysoka i niezbędne jest sprawdzenie danych szczegółowych wyniku w treści pracy.

Poziomy tolerancji ustawiane są dla całej instytucji lub dla poszczególnych jednostek według indywidualnych preferencji tych jednostek, tak aby odzwierciedlały potrzeby i regulacje wewnętrzne instytucji. JSA domyślnie ustawia wartości przedstawiające jedynie umowny podział - nie stanowią one żadnych norm odniesienia i nie są regulowane ustawowo.

/var/www/html/dokuwiki/data/pages/podrecznik/wynik_badania/jak_czytac_wynik_badania.txt · ostatnio zmienione: 2018/11/21 08:19 przez edulinska