Tuesday 12 December 2017

Ms excel moving average analysis


Eva Goldwater Centrum Doradztwa Biostatystycznego University of Massachusetts School of Public Health zaktualizowano w lutym 2007 r. W skrócie Użyliśmy Excela do wykonania podstawowych zadań analizy danych, aby sprawdzić, czy jest to rozsądna alternatywa dla używania pakietu statystycznego do tych samych zadań. Doszliśmy do wniosku, że program Excel to kiepski wybór do analizy statystycznej wykraczającej poza przykłady podręczników, najprostsze statystyki opisowe lub więcej niż kilka kolumn. Napotkane problemy, które doprowadziły do ​​tego wniosku, dotyczą czterech ogólnych obszarów: brakujące wartości są obsługiwane niespójnie, a czasami niepoprawnie. Organizacja danych różni się w zależności od analizy, co zmusza do reorganizacji danych na wiele sposobów, jeśli chcesz wykonać wiele różnych analiz. Wiele analiz można wykonać tylko w jednej kolumnie na raz, co sprawia, że ​​wykonanie tej samej analizy na wielu kolumnach jest niewygodne. Wynik jest źle zorganizowany, czasami nieodpowiednio oznakowany i nie ma zapisów dotyczących sposobu przeprowadzenia analizy. Excel jest wygodny do wprowadzania danych i szybkiego manipulowania wierszami i kolumnami przed analizą statystyczną. Jednak gdy jesteś gotowy na analizę statystyczną, zalecamy użycie pakietu statystycznego, takiego jak SAS, SPSS, Stata, Systat lub Minitab. Wprowadzenie Excel jest prawdopodobnie najczęściej używanym arkuszem kalkulacyjnym na komputery PC. Nowo zakupione komputery często są dostarczane z już załadowanym programem Excel. Łatwo można go używać do wykonywania różnych obliczeń, obejmuje zbiór funkcji statystycznych i zestaw narzędzi do analizy danych. W rezultacie, jeśli nagle zauważysz, że musisz wykonać analizę statystyczną, możesz uznać to za oczywisty wybór. Postanowiliśmy zrobić kilka testów, aby sprawdzić, jak dobrze Excel będzie służył jako aplikacja do analizy danych. Aby przedstawić wyniki, użyjemy małego przykładu. Dane dla tego przykładu są fikcyjne. Wybrano dwie zmienne kategoryczne i dwie ciągłe, abyśmy mogli przetestować różne podstawowe techniki statystyczne. Ponieważ prawie wszystkie prawdziwe zestawy danych mają co najmniej kilka brakujących punktów danych, a ponieważ umiejętność poprawnego radzenia sobie z brakującymi danymi jest jedną z funkcji, które przyjmujemy za pewnik w pakiecie analizy statystycznej, wprowadziliśmy dwie puste komórki w danych: Każdy wiersz arkusza kalkulacyjnego reprezentuje podmiot. Pierwszy pacjent otrzymał Leczenie 1 i uzyskał Wynik 1. Wartości X i Y są wartościami dwóch pomiarów na każdym osobniku. Nie byliśmy w stanie uzyskać pomiaru Y dla drugiego pacjenta lub X dla ostatniego pacjenta, więc te komórki są puste. Tematy są wprowadzane w kolejności, w której dane stały się dostępne, więc dane nie są uporządkowane w żaden szczególny sposób. Wykorzystaliśmy te dane do wykonania prostych analiz i porównaliśmy wyniki ze standardowym pakietem statystycznym. Porównanie uwzględniało dokładność wyników, a także łatwość, z jaką interfejs mógł być używany w przypadku większych zbiorów danych - tj. Więcej kolumn. Użyliśmy SPSS jako standardu, chociaż każdy z pakietów statystycznych obsługiwanych przez OIT zrobiłby to równie dobrze w tym celu. W tym artykule, gdy mówimy o pakiecie statystycznym kwot, mamy na myśli SPSS, SAS, STATA, SYSTAT lub Minitab. Większość procedur statystycznych Excela jest częścią pakietu narzędzi do analizy danych, który znajduje się w menu Narzędzia. Obejmuje on szereg opcji, w tym proste statystyki opisowe, testy t, korelacje, 1 lub 2-drożną analizę wariancji, regresji itd. Jeśli nie masz elementu analizy danych w menu Narzędzia, musisz zainstalować Dane Analysis ToolPak. Wyszukaj w Pomocy dla Narzędzia do analizy danych z zapytania, aby uzyskać instrukcje dotyczące ładowania ToolPak. Dwie inne funkcje programu Excel są przydatne w przypadku niektórych analiz, ale pakiet narzędzi do analizy danych jest jedynym, który zapewnia sensownie kompletne testy istotności statystycznej. Tabela przestawna w menu Dane może być używana do generowania tabel podsumowań średnich, odchyleń standardowych, zliczeń itp. Można również użyć funkcji do wygenerowania pewnych miar statystycznych, takich jak współczynnik korelacji. Funkcje generują pojedynczą liczbę, więc przy użyciu funkcji najprawdopodobniej będziesz musiał łączyć bity i kawałki, aby uzyskać to, czego chcesz. Mimo to możesz nie być w stanie wygenerować wszystkich części, których potrzebujesz do pełnej analizy. O ile nie zaznaczono inaczej, wszystkie testy statystyczne z wykorzystaniem Excela zostały wykonane przy użyciu narzędzia Data Analysis ToolPak. Aby sprawdzić różne testy statystyczne, wybraliśmy następujące zadania: Uzyskaj średnie i odchylenia standardowe dla X i Y dla całej grupy i dla każdej grupy leczenia. Uzyskaj korelację między X i Y. Wykonaj test t próbny na dwie próbki, aby sprawdzić, czy dwie grupy traktowania różnią się w X i Y. Wykonaj sparowany test t, aby sprawdzić, czy X i Y są statystycznie różne od siebie. Porównaj liczbę osobników z każdym wynikiem przez grupę leczenia, stosując test chi-kwadrat. Wszystkie te zadania są rutynowe dla zestawu danych tego rodzaju, a wszystkie z nich można łatwo wykonać przy użyciu dowolnego z pakietów statystycznych wymienionych na liście. Zagadnienia ogólne Włącz zestaw narzędzi do analizy Zestaw narzędzi do analizy danych nie jest instalowany ze standardową konfiguracją programu Excel. Spójrz w menu Narzędzia. Jeśli nie masz elementu analizy danych, musisz zainstalować narzędzia analizy danych. Wyszukaj w Pomocy narzędzia analizy danych quotquo, aby uzyskać instrukcje. Brakujące wartości Pusta komórka to jedyny sposób, w jaki program Excel radzi sobie z brakującymi danymi. Jeśli masz inne kody brakujących wartości, będziesz musiał zmienić je na puste. Rozmieszczenie danych Różne analizy wymagają ułożenia danych na różne sposoby. Jeśli planujesz wiele różnych testów, może nie być jednej umowy, która zadziała. Prawdopodobnie będziesz musiał zmienić rozmieszczenie danych na kilka sposobów, aby uzyskać wszystko, czego potrzebujesz. Okna dialogowe Wybierz Narzędzia Analiza danych i wybierz rodzaj analizy, którą chcesz wykonać. Typowe okno dialogowe będzie zawierało następujące elementy: Zakres wejściowy: Wpisz komórki z lewego górnego i prawego dolnego rogu. na przykład A1: B100. Możesz wybrać tylko sąsiadujące wiersze i kolumny. O ile nie ma pola wyboru do grupowania danych według wierszy lub kolumn (i zazwyczaj nie ma takich danych), wszystkie dane są traktowane jako jeden ruch. Etykiety - czasami można zaznaczyć pole, które wskazuje, że pierwszy wiersz arkusza zawiera etykiety. Jeśli masz etykiety w pierwszym rzędzie, zaznacz to pole, a twoje dane wyjściowe MOGĄ być oznaczone etykietą. Z drugiej strony może nie. Położenie wyjściowe - domyślnie jest nowy arkusz. Lub wpisz adres komórki w lewym górnym rogu miejsca, w którym chcesz umieścić dane wyjściowe w bieżącym arkuszu. Nowy arkusz roboczy to kolejna opcja, której nie próbowałem. Rozgałęzienia tego wyboru omówiono poniżej. Inne elementy, w zależności od analizy. Położenie wyjściowe Dane wyjściowe z każdej analizy mogą zostać przesłane do nowego arkusza w bieżącym pliku Excela (jest to ustawienie domyślne) lub można umieścić je w bieżącym arkuszu, określając komórkę lewego górnego rogu w miejscu, w którym ma ona być umieszczona. Tak czy inaczej jest trochę uciążliwe. Jeśli każde wyjście jest w nowym arkuszu, otrzymujesz wiele arkuszy, z których każdy ma niewielki fragment wyniku. Jeśli umieścisz je w bieżącym arkuszu, musisz umieścić je odpowiednio zostawiając miejsce na dodawanie komentarzy, a zmiany etykiety, które musisz wprowadzić, aby poprawnie sformatować jeden wynik, mogą negatywnie wpłynąć na inny wynik. Przykład: Dane wyjściowe ze strony opisowej mają kolumnę z etykietami, na przykład Odchylenie standardowe, Błąd standardowy itp. Aby ta etykieta mogła być czytana, należy ją rozłożyć na całą szerokość. Ale jeśli proste wyjście częstotliwości jest tuż pod spodem, wtedy kolumna wyświetlająca wartości, które są liczone, która może zawierać małe liczby całkowite, również będzie szeroka. Wyniki analiz Statystyki opisowe Najszybszym sposobem uzyskania średnich i odchyleń standardowych dla całej grupy jest użycie opcji Opis w narzędziach do analizy danych. Możesz wybrać kilka sąsiednich kolumn dla zakresu wejściowego (w tym przypadku kolumn X i Y), a każda kolumna jest analizowana osobno. Etykiety w pierwszym rzędzie służą do oznaczania danych wyjściowych, a puste komórki są ignorowane. Jeśli masz więcej nieprzylegających kolumn, które musisz przeanalizować, będziesz musiał powtórzyć proces dla każdej grupy sąsiednich kolumn. Procedura jest prosta, może wydajnie zarządzać wieloma kolumnami, a puste komórki są traktowane poprawnie. Aby uzyskać średnie i standardowe odchylenia X i Y dla każdej grupy leczenia, należy użyć tabel przestawnych (chyba że chcesz zmienić arkusz danych, aby oddzielić dwie grupy). Po wybraniu (ciągłego) zakresu danych, w opcji Układ wizardów tabeli przestawnej, przeciągnij Traktowanie do obszaru zmiennej Wiersz, a X do obszaru Dane. Kliknij dwukrotnie LdquoCount of Xrdquo w obszarze danych i zmień go na Average. Ponownie przeciągnij X do pola danych, a tym razem zmień liczbę na StdDev. Na koniec przeciągnij X jeszcze raz, pozostawiając go jako Liczbę X. To da nam Średnie, odchylenie standardowe i liczbę obserwacji w każdej grupie leczenia dla X. Zrób to samo dla Y, więc otrzymamy średnią, standardową odchylenie i liczba obserwacji dla Y również. Spowoduje to umieszczenie w sumie sześciu pozycji w polu Data (trzy dla X i trzy dla Y). Jak widać, jeśli chcesz uzyskać wiele statystyk opisowych dla wielu zmiennych, proces ten będzie nudny. Pakiet statystyczny pozwala wybrać dowolną liczbę zmiennych do statystyk opisowych, niezależnie od tego, czy są one przylegające. Możesz otrzymać statystyki opisowe dla wszystkich przedmiotów razem lub z podziałem na zmienne kategoryczne, takie jak leczenie. Możesz wybrać statystyki, które chcesz zobaczyć raz, i będzie ono dotyczyło wszystkich wybranych zmiennych. Korelacje Używając narzędzi do analizy danych, okno dialogowe dla korelacji jest podobne do tego, które jest dla opisów - możesz wybrać kilka sąsiednich kolumn i uzyskać macierz wyjściową wszystkich par korelacji. Puste komórki są odpowiednio ignorowane. Dane wyjściowe NIE zawierają liczby par punktów danych używanych do obliczenia każdej korelacji (które mogą się różnić w zależności od tego, gdzie brakuje brakujących danych) i nie wskazują, czy którakolwiek z korelacji jest statystycznie istotna. Jeśli chcesz korelować w kolumnach, które nie sąsiadują, musisz uwzględnić kolumny pośrednie lub skopiować wybrane kolumny do sąsiedniej lokalizacji. Pakiet statystyczny pozwoliłby wybrać nieciągłe kolumny dla twoich korelacji. Dane wyjściowe wskazują, ile par punktów danych zostało wykorzystanych do obliczenia każdej korelacji i które korelacje są statystycznie istotne. Test z dwiema próbami Test można wykorzystać do sprawdzenia, czy obie grupy leczenia różnią się wartościami X lub Y. Aby wykonać test, należy wprowadzić zakres komórek dla każdej grupy. Ponieważ dane nie zostały wprowadzone przez grupę leczenia, najpierw musimy posortować rzędy według leczenia. Pamiętaj, aby wziąć wszystkie pozostałe kolumny wraz z leczeniem, aby dane dla każdego przedmiotu pozostały nienaruszone. Po posortowaniu danych można wprowadzić zakres komórek zawierających pomiary X dla każdego zabiegu. Nie dołączaj wiersza z etykietami, ponieważ druga grupa nie ma wiersza etykiety. Dlatego twoje dane wyjściowe nie będą oznaczone, aby wskazać, że to wyjście jest dla X. Jeśli chcesz, aby dane wyjściowe były oznaczone, musisz skopiować komórki odpowiadające drugiej grupie do oddzielnej kolumny i wprowadzić wiersz z etykietą dla drugiej grupy . Jeśli chcesz również wykonać test t dla pomiarów Y, musisz powtórzyć proces. Puste komórki są ignorowane i inne niż problemy z etykietowaniem wyniku, wyniki są poprawne. Pakiet statystyczny wykona to zadanie bez konieczności sortowania danych lub kopiowania ich do innej kolumny, a wyniki będą zawsze poprawnie etykietowane w zakresie, w jakim podajesz etykiety dla zmiennych i grup leczenia. Pozwoli to również wybrać więcej niż jedną zmienną jednocześnie dla testu t (np. X i Y). Sparowany test t-Studenta Sparowany test t-testowy jest metodą sprawdzającą, czy różnica między dwoma pomiarami na tym samym obiekcie jest znacząco różna od 0. W tym przykładzie chcemy przetestować różnicę między X i Y zmierzoną na tym samym przedmiocie. Ważną cechą tego testu jest to, że porównuje on pomiary z każdym obiektem. Jeśli skanujesz kolumny X i Y osobno, nie wyglądają one oczywiście inaczej. Ale jeśli spojrzysz na każdą parę X-Y, zauważysz, że w każdym przypadku X jest większa niż Y. Sparowany test t powinien być wrażliwy na tę różnicę. W dwóch przypadkach, gdy brakuje X lub Y, nie ma możliwości porównania dwóch miar na temat. W związku z tym, tylko 8 rzędów jest użytecznych dla sparowanego t-testu. Po uruchomieniu sparowanego testu t dla tych danych, uzyskasz statystkę t 0,09, z prawdopodobieństwem 2-końcowym wynoszącym 0,93. Test nie znajduje żadnej znaczącej różnicy między X i Y. Patrząc na wynik dokładniej, zauważamy, że jest tam 9 obserwacji. Jak wspomniano powyżej, powinno być tylko 8. Wydaje się, że Excel nie wykluczył obserwacji, które nie miały zarówno pomiarów X, jak i Y. Aby uzyskać poprawne wyniki, skopiuj X i Y do dwóch nowych kolumn i usuń dane z komórek, które nie mają wartości dla drugiego taktu. Teraz ponownie uruchom sparowany test t-Studenta. Tym razem statystyka t wynosi 6.14817 z prawdopodobieństwem 2-końcowym wynoszącym 0,000468. Wniosek jest zupełnie inny Oczywiście, jest to skrajny przykład. Ale chodzi o to, że Excel nie oblicza prawidłowo sparowanego t-testu, gdy niektóre obserwacje mają jeden z pomiarów, ale nie drugi. Chociaż możliwe jest uzyskanie poprawnego wyniku, nie ma powodu, aby podejrzewać wyniki, chyba że jesteś wystarczająco czujny, aby zauważyć, że liczba obserwacji jest błędna. W pomocy online nie ma nic, co mogłoby Cię ostrzec przed tym problemem. Co ciekawe, istnieje również funkcja TTEST, która podaje poprawne wyniki dla tego przykładu. Wygląda na to, że funkcje i narzędzia analizy danych nie są spójne w sposobie radzenia sobie z brakującymi komórkami. Niemniej jednak nie mogę zalecać używania funkcji przed narzędziami do analizy danych, ponieważ wynikiem użycia funkcji jest jedna liczba - w tym przypadku prawdopodobieństwo 2-końcowej statystyki t. Funkcja ta nie daje ci samej statystyki t, stopni swobody ani dowolnej liczby innych elementów, które chciałbyś zobaczyć, gdybyś wykonywał test statystyczny. Pakiety statystyczne poprawnie wykluczą przypadki z jednym z brakujących pomiarów i dostarczą wszystkich statystyk pomocniczych potrzebnych do zinterpretowania danych wyjściowych. Crosstabulacja i test niezależności Chi-Squared Naszym ostatecznym zadaniem jest zliczenie dwóch wyników w każdej grupie leczenia i użycie testu niezależności chi-kwadrat w celu sprawdzenia związku między leczeniem a wynikiem. Aby policzyć wyniki grupy leczenia, należy użyć tabel przestawnych. W opcji Układ kreatorów tabeli przestawnej przeciągnij Traktowanie do wiersza, Wynik do kolumny, a także do danych. Obszar danych powinien powiedzieć quotount Outcomequot ndash, jeśli nie, kliknij go dwukrotnie i wybierz quotCountquot. Jeśli chcesz procenty, kliknij dwukrotnie quotount Wyciągu, a następnie kliknij Opcje w polu Wyświetlanie danych ASrdquo, które się pojawi, wybierz quot of rowquot. Jeśli chcesz zarówno zliczeń, jak i procentów, możesz dwukrotnie przeciągnąć tę samą zmienną do obszaru danych i użyć jej raz dla zliczeń i raz dla procentów. Jednak uzyskanie testu chi-kwadrat nie jest takie proste. Jest dostępny tylko jako funkcja, a dane wejściowe potrzebne do funkcji to liczba obserwowanych w każdej kombinacji leczenia i wyniku (które masz w tabeli przestawnej) oraz oczekiwana liczba w każdej kombinacji. Oczekiwane liczby Co to jest Jak je uzyskać Jeśli masz wystarczające dane statystyczne, aby wiedzieć, jak obliczyć spodziewane liczby, i można wykonywać obliczenia w programie Excel przy użyciu względnych i bezwzględnych adresów komórkowych, powinieneś być w stanie poruszać się po tym. Jeśli nie, masz pecha. Zakładając, że udało ci się przezwyciężyć problem oczekiwanych zliczeń, możesz użyć funkcji Chitest, aby uzyskać prawdopodobieństwo zaobserwowania wartości chi-kwadrat większej niż ta dla tej tabeli. Ponownie, ponieważ używamy funkcji, nie dostajemy wielu innych niezbędnych elementów obliczeń, w szczególności wartości statystyki chi-kwadrat lub jej stopni swobody. Żaden pakiet statystyczny nie wymagałby podania oczekiwanych wartości przed obliczeniem testu chi-kwadrat niestosowania. Ponadto, wyniki zawsze będą zawierać statystykę chi-kwadrat i jej stopnie swobody, a także jej prawdopodobieństwo. Często dostaniesz również dodatkowe statystyki. Analizy dodatkowe Pozostałe analizy nie zostały wykonane na tym zbiorze danych, ale niektóre komentarze na ich temat zostały uwzględnione w celu ich kompletności. Proste częstotliwości Za pomocą tabel przestawnych można uzyskać proste częstotliwości. (Aby uzyskać więcej informacji o tym, jak uzyskać tabele przestawne, zobacz Rozkład tabeli.) Przy użyciu tabel przestawnych każda kolumna jest traktowana jako oddzielna zmienna, a etykiety na wierszu 1 będą wyświetlane na wydruku. Możesz wykonać tylko jedną zmienną naraz. Inną możliwością jest użycie funkcji Częstotliwości. Główną zaletą tej metody jest to, że po zdefiniowaniu funkcji częstotliwości dla jednej kolumny można użyć CopyPaste, aby uzyskać ją dla innych kolumn. Najpierw musisz wprowadzić kolumnę z wartościami, które chcesz policzyć (pojemniki). Jeśli zamierzasz wykonywać częstotliwości dla wielu kolumn, pamiętaj, aby wprowadzić wartości dla kolumny z największą liczbą kategorii. na przykład jeśli 3 kolumny mają wartości 1 lub 2, a czwarta ma wartości 1,2,3,4, należy wpisać wartości bin jako 1,2,3,4. Teraz wybierz tyle pustych komórek w jednej kolumnie, aby zapisać wyniki - 4 w tym przykładzie, nawet jeśli bieżąca kolumna ma tylko 2 wartości. Następnie wybierz InsertFunctionStatisticalFrequencies w menu. Wypełnij zakres wejściowy pierwszej kolumny, którą chcesz zliczyć, używając względnych adresów (np. A1: A100). Wypełnij Zakres zasobu za pomocą bezwzględnych adresów miejsc, w których wprowadziłeś wartości do zliczenia (np. M1: M4). Kliknij Zakończ. Zwróć uwagę na pole nad nagłówkami kolumn w arkuszu, w którym wyświetlana jest formuła. Zaczyna się od wartości CZĘSTOTLIWOŚCI (quot. Umieść kursor po lewej stronie znaku we wzorze i naciśnij Ctrl-Shift-Enter Liczba zliczeń pojawi się teraz w zaznaczonych komórkach. Aby uzyskać wartości częstotliwości innych kolumn, wybierz komórki z częstotliwościami w nich i wybierz EditCopy z menu. Jeśli następna kolumna, którą chcesz zliczyć, to jedna kolumna na prawo od poprzedniej, wybierz komórkę po prawej stronie pierwszej komórki częstotliwości i wybierz EditPaste ( ctrl-V). Kontynuuj przesuwanie w prawo i wklejanie dla każdej kolumny, którą chcesz policzyć. Za każdym razem, gdy przenosisz jedną kolumnę na prawo od pierwotnych komórek częstotliwości, kolumna, która ma być zliczana, przesuwa się w prawo od pierwszej zliczonej kolumny. Jeśli chcesz również procentów, yoursquoll musi użyć funkcji Sum, aby obliczyć sumę częstotliwości, i zdefiniować wzór, aby uzyskać procent dla jednej komórki. Wybierz komórkę do przechowywania pierwszego procentu i wpisz formułę do formuły pole u góry arkusza - np. N1100N 5 - gdzie N1 jest komórką z częstotliwością dla pierwszej kategorii, a N5 jest komórką z sumą częstotliwości. Użyj CopyPaste, aby uzyskać formułę dla pozostałych komórek pierwszej kolumny. Gdy masz procenty dla jednej kolumny, możesz skopiować je do innych kolumn. Yoursquoll musi być ostrożny przy używaniu adresów względnych i bezwzględnych W powyższym przykładzie użyliśmy N5 dla mianownika, więc gdy skopiujemy formułę do następnej częstotliwości w tej samej kolumnie, to nadal będzie szukać sumy w rzędzie 5 ale gdy skopiujemy formułę do innej kolumny, przejdzie ona do częstotliwości w następnej kolumnie. Na koniec możesz użyć Histogramu w menu Analiza danych. Możesz wykonać tylko jedną zmienną naraz. Podobnie jak w przypadku funkcji Frequencies, należy wprowadzić kolumnę z granicami quotbinquot. Aby policzyć liczbę wystąpień 1 i 2, należy wprowadzić 0,1,2 w trzech sąsiadujących komórkach i podać zakres tych trzech komórek jako przedziały w oknie dialogowym. Dane wyjściowe nie są oznaczone żadnymi etykietami, które możesz mieć w wierszu 1, ani nawet literą kolumny. Jeśli wykonujesz częstotliwości na wielu zmiennych, będziesz miał trudności z ustaleniem, która częstotliwość należy do której kolumny danych. Regresja liniowa Ponieważ regresja jest jedną z częściej używanych analiz statystycznych, wypróbowaliśmy ją, mimo że nie wykonaliśmy analizy regresji dla tego przykładu. Procedura Regresja w narzędziach analizy danych pozwala wybrać jedną kolumnę jako zmienną zależną i zestaw kolumn sąsiadujących z niezależnymi. Jednak nie toleruje żadnych pustych komórek w dowolnym miejscu zakresów wejściowych, a użytkownik jest ograniczony do 16 zmiennych niezależnych. Dlatego jeśli masz puste komórki, musisz skopiować wszystkie kolumny biorące udział w regresji do nowych kolumn i usunąć wszystkie wiersze zawierające puste komórki. Duże modele z więcej niż 16 predykcjami nie mogą być w ogóle wykonane. Analiza wariancji Zasadniczo, cechy ANOVA Excels są ograniczone do kilku specjalnych przypadków rzadko spotykanych poza podręcznikami i wymagają wielu zmian w danych. Jednokierunkowe ANOVA Dane muszą być ułożone w oddzielnych i sąsiednich kolumnach (lub rzędach) dla każdej grupy. Oczywiście nie sprzyja to jednokierunkowości w więcej niż jednej grupie. Jeśli masz etykiety w wierszu 1, dane wyjściowe będą korzystać z etykiet. ANOVA z dwoma czynnikami bez replikacji Ma to miejsce tylko w przypadku jednej obserwacji na komórkę (to znaczy nie występuje błąd związany z komórką wewnętrzną). Zakres wejściowy to prostokątne ułożenie komórek, z rzędami reprezentującymi poziomy jednego czynnika, kolumnami poziomów innego czynnika, a zawartość komórki - jedną wartością w tej komórce. ANOVA z dwoma czynnikami z replikacjami Powoduje to dwukierunkową ANOVA o równych rozmiarach komórek. Wejście musi być prostokątnym obszarem z kolumnami reprezentującymi poziomy jednego czynnika, a wiersze reprezentujące kopie w obrębie poziomów innego czynnika. Zakres wejściowy MUSI również zawierać dodatkowy wiersz u góry i kolumnę po lewej stronie, z etykietami wskazującymi czynniki. Jednak te etykiety nie są używane do oznaczania wynikowej tabeli ANOVA. Kliknij Pomoc w oknie dialogowym ANOVA, aby zobaczyć obraz zakresu wejściowego. Żądanie wielu analiz Jeśli miałeś wiele różnych procedur statystycznych, które chciałbyś wykonać na swoich danych, prawie na pewno będziesz musiał dużo sortować, zmieniać układ, kopiować i wklejać swoje dane. Dzieje się tak, ponieważ każda procedura wymaga, aby dane były ułożone w określony sposób, często różniący się od sposobu, w jaki inna procedura chce uporządkować dane. W naszym małym teście musieliśmy posortować wiersze, aby wykonać test t, i skopiować niektóre komórki, aby uzyskać etykiety dla danych wyjściowych. Musieliśmy wyczyścić zawartość niektórych komórek w celu uzyskania prawidłowego sparowanego t-testu, ale nie chcieliśmy, aby te komórki zostały wyczyszczone dla innego testu. A my robiliśmy tylko pięć zadań. Nie robi się lepiej, gdy próbujesz zrobić więcej. Nie ma pojedynczego układu danych, który pozwoliłby na wykonanie wielu różnych analiz bez wykonywania wielu różnych kopii danych. Potrzeba manipulowania danymi na wiele sposobów znacznie zwiększa szansę na wprowadzenie błędów. Używając programu statystycznego, dane byłyby zwykle ułożone z wierszami reprezentującymi podmioty, a kolumny reprezentujące zmienne (tak jak w naszych przykładowych danych). Dzięki tej aranżacji możesz wykonywać dowolne analizy omówione tutaj, a także wiele innych, bez konieczności sortowania lub zmiany swoich danych w jakikolwiek sposób. Tylko znacznie bardziej złożone analizy, poza możliwościami Excela i zakresem tego artykułu, wymagałyby przegrupowania danych. Praca z wieloma kolumnami Co by było, gdyby dane nie zawierały 4, ale 40 kolumn, z mieszanką miar jakościowych i ciągłych? Jak łatwo można skalować powyższe procedury do większego problemu. W najlepszym przypadku niektóre procedury statystyczne mogą akceptować wiele sąsiednich kolumn dla danych wejściowych i interpretować każdą kolumnę jako inną miarę. Procedury opisów i korelacji są tego rodzaju, więc możesz zażądać statystyk opisowych lub korelacji dla dużej liczby zmiennych ciągłych, o ile są one wprowadzane w sąsiednich kolumnach. Jeśli nie sąsiadują ze sobą, musisz zmienić kolejność kolumn lub użyć polecenia "kopiuj i wklej", aby byłysiadować. Wiele procedur można jednak zastosować tylko do jednej kolumny na raz. Testy T (niezależne lub sparowane), proste częstotliwości, test niezależności chi-kwadrat i wiele innych procedur są w tej klasie. Stanowiłoby to poważną wadę, gdybyś miał więcej niż garść kolumn, nawet jeśli używasz wycinania i wklejania lub makr w celu zmniejszenia pracy. Oprócz wielokrotnego powtarzania żądania, musisz zdecydować, gdzie przechowywać wyniki każdego z nich, i upewnić się, że jest odpowiednio oznakowany, abyś mógł łatwo zlokalizować i zidentyfikować każde wyjście. Na koniec program Excel nie udostępnia dziennika ani innego rekordu do śledzenia wykonanych czynności. Może to być poważną wadą, jeśli chcesz móc powtórzyć tę samą (lub podobną) analizę w przyszłości lub nawet po prostu zapomnieć o tym, co już zrobiłeś. Korzystając z pakietu statystycznego, możesz poprosić o test na tyle zmiennych, ile potrzebujesz na raz. Każda z nich będzie odpowiednio oznaczona i ułożona na wydruku, więc nie ma wątpliwości co do tego, co. Możesz także uzyskać dziennik, a często także zestaw poleceń, które można wykorzystać do udokumentowania pracy lub do powtórzenia analizy bez konieczności ponownego wykonywania wszystkich czynności. Chociaż Excel jest cienkim arkuszem kalkulacyjnym, nie jest to pakiet analizy danych statystycznych. Przy całej uczciwości nigdy nie miało to być jedno. Należy pamiętać, że Data Analysis ToolPak to quotadd-inquot - dodatkowa funkcja, która umożliwia wykonanie kilku szybkich obliczeń. Nie powinno więc dziwić, że właśnie to jest dobre - kilka szybkich obliczeń. Jeśli spróbujesz użyć go do bardziej szczegółowych analiz, napotkasz trudności wynikające z jednego lub wszystkich z następujących ograniczeń: Potencjalne problemy z analizami z brakującymi danymi. Mogą być podstępne, ponieważ nieostrożny użytkownik prawdopodobnie nie zda sobie sprawy, że coś jest nie tak. Brak elastyczności w analizach, które można wykonać ze względu na oczekiwania dotyczące uporządkowania danych. Powoduje to konieczność przycinania i przerabiania arkusza danych na różne sposoby, zwiększając prawdopodobieństwo wystąpienia błędów. Dane wyjściowe są rozproszone w wielu różnych arkuszach roboczych lub całym arkuszu kalkulacyjnym, w którym należy wziąć odpowiedzialność za porządkowanie w rozsądny sposób. Dane wyjściowe mogą być niekompletne lub mogą nie być odpowiednio oznakowane, co zwiększa prawdopodobieństwo błędnego zidentyfiko - wania danych wyjściowych. Musisz wielokrotnie powtarzać żądania dotyczące niektórych analiz, aby uruchomić je dla wielu zmiennych lub zażądać wielu opcji. Trzeba zrobić kilka rzeczy, definiując własne funkcje, z towarzyszącym ryzykiem błędów. Brak informacji o tym, co zrobiłeś, aby wygenerować wyniki, utrudniając udokumentowanie analizy lub powtórzenie jej w późniejszym czasie, jeśli to konieczne. Jeśli masz więcej niż około 10 lub 12 kolumn i chcesz zrobić coś poza statystykami opisowymi i prawdopodobnie korelacjami, powinieneś używać pakietu statystycznego. Jest kilka odpowiednich dostępnych przez licencję na stronie przez OIT, lub możesz ich używać w dowolnym laboratorium komputerowym OIT. Jeśli posiadasz program Excel na swoim komputerze i nie chcesz płacić za program statystyczny, koniecznie użyj Excela do wprowadzenia danych (z wierszami przedstawiającymi tematy i kolumny dla zmiennych). Wszystkie wymienione pakiety statystyczne mogą odczytywać pliki Excel, więc możesz zrobić (czasochłonnym) wprowadzanie danych w domu i udać się do laboratorium, aby wykonać analizę. Znacznie szersza dyskusja na temat pułapek korzystania z programu Excel, z wieloma dodatkowymi linkami, jest dostępna w burns-stat Kliknij na samouczki, a następnie na dodatek do arkusza kalkulacyjnego. Aby uzyskać pomoc lub więcej informacji o oprogramowaniu statystycznym, skontaktuj się z biurem konsultingowym Biostatistics. Telefon 545-2949 O 20:00 czasu CST Piątek, 24 lutego - 18:00 czasu CST Sobota, 25 lutego, ni będą przechodzić aktualizacje systemu, które mogą spowodować tymczasową przerwę w świadczeniu usług. Dziękujemy za cierpliwość, ponieważ poprawiamy jakość korzystania z internetu. Przenoszenie poza Microsoft Excel do analizy danych pomiarowych i raportowania Data publikacji: 18, 2017 44 4,39 5 Drukuj Z uwagi na szeroką dostępność program Microsoft Excel jest często de facto wyborem inżynierów i naukowców potrzebujących oprogramowania do analizy danych pomiarowych i manipulacja. Microsoft Excel nadaje się dobrze do wyjątkowo prostych aplikacji testowych i pomiarowych oraz do zastosowań finansowych, dla których został zaprojektowany, jednak w czasach, gdy firmy zmuszane są robić więcej za mniej, wybór odpowiednich narzędzi w celu zmaksymalizowania wydajności (a tym samym obniżenia kosztów) jest konieczny . To, że program Microsoft Excel jest już zainstalowany na Twoim komputerze, nie jest odpowiednim narzędziem do każdego zadania. Oprogramowanie National Instruments DIAdem, które zostało stworzone specjalnie do zarządzania, kontroli, analizy i raportowania uzyskanych lub symulowanych danych inżynieryjnych i naukowych, zapewnia wzrost wydajności i skalowalności dzięki funkcjom, które pozwalają pokonywać ograniczenia programu Excel w większości aplikacji do przetwarzania danych. Spis treści 1. Różnice w fundamentalnych elementach konstrukcyjnych: komórki w porównaniu z kanałami Microsoft Excel wykorzystuje komórkę jako jej podstawowy blok konstrukcyjny.160 Komórki tworzą rzędy i kolumny, tworząc arkusz kalkulacyjny, architekturę idealną dla budżetów i bilansów.160 Prosty na przykład aplikacje do zbierania danych jednopunktowych, które zbierają jeden punkt danych na godzinę w ciągu dnia, często łatwo są mapowane do tej architektury, ponieważ każdy indywidualny punkt danych ma większe znaczenie, gdy zbieranych jest mniej punktów danych.160 Każde dane punkt istnieje jako komórka w arkuszu kalkulacyjnym i musi zostać zmanipulowany za pomocą paradygmatu opartego na komórkach Excels. Większość aplikacji do zbierania danych nie jest jednak tak banalna.160 Aplikacje, które zbierają dziesiątki kanałów danych przy stawkach megapróbka na sekundę (MS) są powszechne.160 W tych aplikacjach manipulowanie danymi i interakcja odbywa się na sygnale lub kanale jako a.160 Podczas manipulowania kanałami w Excelu jako kolumnami pojedynczych komórek utracono jedność sygnału.160 Chociaż można jednocześnie manipulować całymi kolumnami programu Excel, jest to bardziej kłopotliwe w przypadku dłuższych kolumn.160 Ponadto kolumny często zawierają opisową informacje takie jak nazwa lub jednostka oprócz surowych danych liczbowych.160 W takim przypadku należy wybrać podzbiór kolumny (na przykład zakres A2: A99), wprowadzając obciążenie i potencjał dla niedokładności lub błędów. Na rysunku 1. Excel służy do prostego, ale powszechnego zadania inżynierskiego: uśrednienie pięciu kanałów temperatur przechowywanych w kolumnach w celu utworzenia wypadkowego kanału średniego.160 Obliczenia uśredniające muszą najpierw zostać wykonane z blokiem konstrukcyjnym komórki, a następnie skopiowane (lub wypełnione) do wszystkie komórki w wynikowej kolumnie.160 Używanie DIAdem, który wykorzystuje kanał jako jego podstawowy element konstrukcyjny, uśrednianie kanałów jest tak proste, jak przeciąganie i upuszczanie kanałów wejściowych do funkcji Średnich kanałów, jak pokazano na Rysunku 2 .160 Indywidualne punkty danych nadal można manipulować w DIAdem, gdy jest to konieczne. Rysunek 1. Microsoft Excel wykorzystuje komórkę jako podstawowy blok budulcowy. 160 Nawet prosta analiza danych musi być zastosowana do komórki, a następnie powtórzona dla wszystkich komórek w kolumnie (kanale). Rysunek 2 . NI DIAdem działa z blokiem konstrukcyjnym kanału160. Uśrednianie jest tak proste, jak przeciąganie i upuszczanie całych kanałów danych zamiast niepotrzebnego manipulowania poszczególnymi punktami danych. 2. Setki obliczeń inżynierskich i analiz naukowych Chociaż liczba dostępnych formuł obliczeń finansowych w Excelu jest duża, należy skonfigurować opcjonalny dodatek o nazwie Analysis Toolpak, umożliwiający dostęp do kilku obliczeń inżynieryjnych i statystycznych.160 Analiza Funkcje ToolPak są bardzo ograniczone, jak pokazano na rysunku 3 ze wspólną obliczeniową obliczeniową Szybką transformacją Fouriera (FFT) .160 Ogólnie, możliwości analizy Excels często nie spełniają wymagań aplikacji naukowych lub inżynieryjnych.160 Dla dalszej rozszerzalności, Excel zapewnia Solidny silnik Visual Basic for Applications (VBA) i doskonałe środowisko edycji VBA, które umożliwia tworzenie własnych obliczeń inżynieryjnych od zera, gdy wbudowane funkcje programu Excels są niewystarczające dla danej aplikacji. Rysunek 3. Microsoft Excel zapewnia kompletny zestaw kalkulacji finansowych i pozwala inżynierom pisać własny kod w celu spełnienia wymagań aplikacji. W systemie DIAdem w środowisku uwzględniono setki obliczeń inżynieryjnych i analiz naukowych od prostego dodawania do złożonej manipulacji matrycą i analizy kolejności.160 Funkcje analizy w programie DIAdem są oparte na konfiguracji, nie jest wymagane żadne programowanie w celu przeprowadzenia nawet złożonej analizy, takiej jak filtrowanie cyfrowe. , jak pokazano na Rysunku 4 .160 Dodatkowo, funkcje analizy DIAdem obejmują pełne podglądy wyników analizy, dzięki czemu można uniknąć błędnych obliczeń, upewniając się, że korzystasz z odpowiednich parametrów przed uruchomieniem każdego obliczenia. Rysunek 4. DIAdem zawiera setki funkcji analitycznych specyficznych dla naukowców i inżynierów.160 Każde obliczenie jest oparte na konfiguracji i zapewnia podgląd wynikowych kanałów, dzięki czemu można wchodzić w interakcje z parametrami w celu zapewnienia dokładności i zmniejszenia błędów. DIAdem zawiera również strukturę do tworzenia własnych obliczeń specyficznych dla domeny, zwaną Menedżerem obliczeń, i zawiera zintegrowany interfejs skryptowy Visual Basic do sekwencjonowania wbudowanych obliczeń DIAdem lub definiowania własnych niestandardowych obliczeń. 3. Ładowanie i manipulowanie dużymi wolumenami danych Prędkości przesyłania strumieni danych w popularnych aplikacjach osiągają lub przekraczają stawki MS.160 W aplikacji, która zbiera jeden kanał danych w 1 państwie członkowskim, w 1-sekundowej akwizycji zostanie zebranych łącznie 1 000 000 punktów danych . W ciągu kilku minut miliardy punktów danych można zapisać na gigabajtach miejsca na dysku twardym. Gdy program Microsoft Excel próbuje załadować plik danych zawierający dużą ilość danych, próbuje załadować każdy pojedynczy punkt danych do pamięci.160 Wraz z wydaniem 64-bitowej wersji programu Microsoft Excel 2017 jest to mniejszy aplikacja ma większą adresowalną pamięć, jednak ładowanie całego dużego zestawu danych do programu Excel często zajmuje wiele minut ze względu na ogromną ilość danych, które muszą zostać załadowane. 160 Ponadto, Excel przechowuje nie tylko wartości liczbowe w każdej komórce ale także numeryczne formatowanie, formatowanie komórek, formuły, łącza do arkuszy kalkulacyjnych, hiperłącza internetowe i komentarze.160 Ta elastyczność zorientowana na komórki jest idealna dla arkuszy kalkulacyjnych biznesowych, w których widoczność na poziomie komórki jest kluczowa, ale dodatkowo zwiększa niepotrzebne obciążenie pamięci dla zestawów danych o milionach wartości . 160 Aby uniknąć potencjalnych problemów z pamięcią, program Excel nakłada ograniczenie na maksymalną liczbę 160rowów i kolumn.160 Wprowadzenie Excel 2007 zwiększyło całkowitą liczbę wierszy na arkusz roboczy z 65 536 do nieco ponad 1 000 000 (dokładnie 20), a suma liczba kolumn od 256 do 16 384 (2 14) .160 Korzystanie z rysunków 5 i 6. contrast Wyróżnia ograniczenie wiersza i kolumny za pomocą możliwości DIAdems do manipulowania 500 000 000 wierszy (punktów) jako zaledwie ułamek jego ograniczenia.160 Rys. 5. Program Excel może załadować tylko 1 milion wierszy danych dla dowolnej kolumny.160 Jest to ograniczenie dla naukowców i inżynierów. Rysunek 6. DIAdem może z łatwością poradzić sobie z bardzo dużymi zbiorami danych.160 Ten obraz pokazuje przykład 160 000 000 000 (pół miliarda) punktów danych w kanale - 500 razy więcej niż maksymalna liczba wierszy dozwolona przez Excel. Jak pokazano na rysunku 5. wskaźnik przejęcia 1 państwa członkowskiego przy użyciu jednego kanału przekroczyłby liczbę punktów danych, które program Excel mógłby załadować w czasie krótszym niż jedna sekunda pozyskania.160 Wielu inżynierów i naukowców czuje się zmuszonych do ograniczenia ograniczeń oprogramowania do przetwarzania danych w celu dyktowania warunki ich pozyskania i albo obniżają wskaźniki akwizycji, albo segmentują przejęcia w wielu plikach danych, wprowadzając koszmar dla zarządzania danymi i organizacji. DIAdem został zaprojektowany do manipulowania danymi pomiarowymi zarówno w małych, jak i dużych ilościach i może przetwarzać do 2 000 000 000 punktów danych (2 31) na kanał na 65 536 (2 16) wszystkich kanałach danych.160 Dodatkowo, DIAdem obejmuje160 selektywnego ładowania, redukcji danych i rejestrowania funkcje ładowania zaprojektowane specjalnie do pracy z bardzo dużymi zbiorami danych.160 DIAdem może selektywnie ładować podzbiór kanałów danych zawartych w pliku danych, podczas gdy Excel zawsze importuje wszystkie kolumny z pliku danych.160 Jeśli potrzebujesz tylko załadować 1 kanał z bardzo dużego pliku danych z 10 kanałami, ładowanie tylko 10 wartości danych, których faktycznie potrzebujesz, jest znacznie szybsze i bardziej wydajne niż metoda Excels ładowania 100 danych, gdy 90 jest nadwyżką.160 Gdy pliki są ładowane przy redukcji danych, DIAdem ładuje dane z wybranego zakresu wierszy i skrapla co N wierszy do jednej reprezentatywnej wartości, podczas gdy Excel zawsze ładuje wszystkie wiersze danych.160 Gdy pliki są załadowane do rejestru, DI Adem używa istniejącego pliku danych na dysku, ponieważ lokalna pamięć wirtualnaDIAdem nie ładuje jednocześnie wszystkich wartości z pliku danych, ale zamiast tego rejestruje, jak uzyskać dostęp do bloków wartości danych na żądanie.160 To powoduje, że rejestry są ładowane tylko w trybie 160read, ale umożliwia bardzo szybkie tworzenie wykresów i kontrolę bardzo dużych zbiorów danych, jak pokazano na rys. 6. Zobacz rozwiązanie użytkownika dotyczące tego, jak DIAdem przetwarza ogromne ilości danych, aby pomóc przewidzieć i monitorować aktywność trzęsienia ziemi. 4. Elastyczność w przechowywaniu plików Format Aplikacje zbierające i zapisujące dane o wysokich przepływnościach muszą zapisywać dane na dysku, korzystając z formatu plików obsługujących streaming.160 Najczęściej wykorzystywane są formaty plików binarnych, ponieważ nie zawierają dodatkowego narzutu wymaganego do utworzenia pliku czytelny dla człowieka sposób, w jaki robią to pliki ASCII.160 Porównanie typowych formatów plików, 160 w tym standardu otwartego formatu binarnego z oprogramowaniem National Instruments o nazwie Technical Data Management Streaming (TDMS), przedstawiono w Tabeli 1. 160160160160160 Tabela 1. Dostępnych jest wiele opcji formatów plików, ale formaty plików binarnych, takie jak TDMS, są jedynymi formatami, które umożliwiają szybkie przesyłanie strumieniowe. Może wymagać zestawu narzędzi lub modułu dodatkowego. DIAdem jest wystarczająco elastyczny, aby odczytać dowolny niestandardowy format pliku, w tym spersonalizowane formaty plików binarnych dzięki modułowym kawałkom kodu o nazwie DataPlugins, które wiedzą, jak analizować i interpretować zawartość pliku danych. 160 DataPlugins również formatuje dane przeanalizowane z konkretnego pliku danych wspólna struktura danych wewnątrz DIAdem, która ułatwia porównywanie danych załadowanych z różnych formatów plików.160 National Instruments opublikował darmowy do pobrania DataPlugins dla setek najczęściej używanych formatów plików danych i są opublikowane API dla LabVIEW i VBScript dla ciebie aby utworzyć DataPlugins dla własnych plików danych. 160 Umożliwia to modułowi DIAdem odpowiednią skalowalność i skalowalność do obsługi dowolnych obecnych, przyszłych lub przyszłych formatów plików danych. W przeciwieństwie do tego, podczas gdy Excel może czytać pliki ASCII, zwykle nie jest w stanie załadować danych z plików binarnych.160 Nawet gdy Excel pomyślnie załaduje plik ASCII, ma ograniczoną zdolność do prawidłowej interpretacji właściwości i struktury kanału pliku danych. Niezwykle często konieczne jest czasochłonne formatowanie zaimportowanych danych ASCII, zanim będzie można z nich korzystać.160 Jedynym wyjątkiem od tego problemu jest format pliku 160TDMS od 160National Instruments, który to program ładuje z poprawnym formatowaniem struktury, właściwości i dane z pliku TDMS, używając160 darmowego dodatku TDM Excel. Odwiedź stronę główną TDMS, aby dowiedzieć się więcej o formacie pliku TDMS do przechowywania danych pomiarowych na dysku. 5. Wbudowane narzędzia do zarządzania danymi i trendami Z czasem powszechne jest przechowywanie i próba uporządkowania setek lub tysięcy plików danych na dysku.160 Pliki te są często przechowywane na różne sposoby przy użyciu różnych formatów, a nawet mogą być przechowywane w różnych lokalizacjach na lokalnym komputerze lub w sieci. Jeśli chcesz trendować dane w wielu plikach danych za pomocą Microsoft Excel, musisz otworzyć każdy indywidualny plik danych, skopiować odpowiednie kolumny i wkleić je do pliku głównego (zagregowanego) i przejść do następnego pliku danych.160 Dokładnie trendy podobne kanały danych w setkach unikatowych plików danych mogą trwać kilka dni lub tygodni. DIAdem może wykonać to samo zadanie w sekundach.160 Używając DataPlugins, DIAdem może załadować te różne formaty plików do wspólnej importowanej struktury dla jednolitej analizy i raportowania. Ponadto DIAdem instaluje technologię o nazwie My DataFinder, która pomaga szybko zlokalizować i wyizolować dokładnie te zestawy danych, których szukasz, nawet jeśli znajdują się one w różnych plikach, jak pokazano na Rysunku 7. 160 Aplikacja My DataFinder automatycznie tworzy indeks informacji opisowych zawarte w plikach danych, które można przeszukiwać w systemie DIAdem.160. Wykorzystując technologię DIAdem i DataFinder, można szybko znaleźć wszystkie pliki danych, które zostały napisane przez danego operatora, zlokalizować wszystkie nieudane testy, a nawet zidentyfikować kanały danych we wszystkich przechowywanych plikach danych przy użyciu określonego rodzaju czujnika.160 Im więcej informacji dokumentujesz w swoich plikach danych, tym więcej możliwości jest dostępnych podczas wyszukiwania określonych danych przechowywanych w wielu plikach w różnych folderach i formatach plików. Rysunek 7. W tym zapytaniu DataFinder umieścił kanały danych we wszystkich plikach danych, które zostały zebrane przy użyciu termopary typu J i zapisane na dysku przez Jennifer, operatora. Zobacz transmisję internetową demonstrującą DIAdem i NI DataFinder do zarządzania danymi, analizy i raportowania. 6. Inspekcja danych i synchronizacja Microsoft Excel umożliwia użytkownikom tworzenie podstawowych wykresów i wykresów, ale statyczne wykresy nie pozwalają na pełną interakcję i kontrolę danych, które zostały zmierzone w czasie.160 Na przykład niemożliwe jest wizualizowanie skorelowanych danych pomiarowych i GPS160data za pomocą wbudowanych narzędzi w Excelu. 160 Aby całkowicie scharakteryzować wszystkie aspekty pomiarów opartych na czasie, DIAdem zawiera potężne narzędzie do wizualizacji, które oferuje w pełni zsynchronizowane obszary wyświetlania idealne do odtwarzania pomiarów skoordynowanych z filmami wideo, modelami 3D, systemami osi, mapami GPS, konturami, odtwarzaniem dźwięku, i więcej.160 Umożliwia to odtworzenie pomiaru zsynchronizowanego z innymi informacjami, aby w pełni zrozumieć jego kontekst.160 Narzędzie wizualizacji DIAdems umożliwia również łatwe powiększanie do określonego regionu wykresu, kopiowanie lub usuwanie lub interpolowanie zakresów danych i badanie dokładne wartości określonych punktów graficznie.160 Za pomocą tego dynamicznego narzędzia można łatwo zidentyfikować obszary zainteresowania lub zlokalizować wartości odstające w większych zbiorach danych. Cyfra 8 . Za pomocą DIAdem można w pełni zsynchronizować odtwarzanie danych pomiarowych, danych dźwiękowych, współrzędnych GPS, wideo i innych. 7. Co-You-See-Is-What-You-Get (WYSIWYG) Szablony raportowania DIAdem jest silnym mechanizmem raportowania, który wykorzystuje szablony wielokrotnego użytku, ponieważ wielu inżynierów wielokrotnie generuje te same raporty przy użyciu różnych zestawów danych.160 Szablony raportów WYSIWYG w DIAdem przechowuje odwołania do danych w pamięci, a nie sam zapisuje rzeczywiste wartości danych. Aby tworzyć raporty z różnych zestawów danych przy użyciu tego samego zapisanego szablonu raportu, można po prostu załadować nowe dane do pamięci, a wczytany szablon raportu natychmiast aktualizuje wyświetlacz 160 z nowo załadowanymi wartościami danych.160 Następnie można wyeksportować ukończoną publikację o wysokiej rozdzielczości - już raportuje do najpopularniejszych formatów raportów, w tym PDF, PowerPoint, HTML, obrazu i innych. 160W Excelu wyświetlanie raportu jest zapisywane razem z danymi we wspólnym pliku arkusza kalkulacyjnego, co znacznie utrudnia korzystanie z określonego wyświetlania raportu dla wielu zestawów danych. 160 Rysunek 9. DIAdem oferuje raporty w formacie WYSIWYG, gotowe do publikacji, eksportowane raporty będą wyglądały identycznie jak szablony czasu edycji. 8. Interaktywna automatyzacja Excel zapewnia potężne środowisko do tworzenia makr.160 Wykorzystując tryb nagrywania, możliwe jest interaktywne rejestrowanie makr, które umożliwiają dłuższe ewaluacje lub obliczenia. 160 DIAdem podobnie 160 zawiera zintegrowany edytor VBScript, edytor okien dialogowych użytkownika i Rejestrator skryptów do interaktywnego generowania skryptów automatyzujących długie oceny lub obliczenia. 160160Korzystając ze skryptów, całe środowisko DIAdem można dostosować i zautomatyzować tak, aby powtarzalne procesy przepływu danych, które były używane przez kilka dni, mogły zostać wykonane w ciągu kilku minut.160 To naprawdę maksymalizuje wydajność inżynierów i naukowców i radykalnie skraca czas ich wykonywania przekształcenie surowych danych pomiarowych w użyteczne informacje. 9. Excel jest darmowy, ale zbyt kosztowny w użyciu Microsoft Office jest używany przez około 80 przedsiębiorstw1 .160 Wielu inżynierów i naukowców postrzega program Excel jako wolne oprogramowanie, ponieważ jest zainstalowany na większości komputerów firmowych bez pytania.160 Często naukowcy i inżynierowie zaczynają korzystać z Excela do celów analizy i raportowania, ponieważ jest on znajomy i dostępny.160 Po napotkaniu ograniczeń Excels podsumowanych w Tabeli 2. żyją często z powtarzalnym i czasochłonnym ręcznym przetwarzaniem lub spędzają wiele godzin i tygodni na opracowywaniu i utrzymywaniu własnego kodu makr. Jeśli oszacujesz, że koszty osobowe (w tym wynagrodzenie, ubezpieczenie, wyposażenie itd.) Za jednego inżyniera w sumie 100 000 rocznie, koszt zakupu jednej licencji DIAdem Advanced i jednego całego tygodnia szkolenia zostanie odzyskany po zaledwie 2,8 tygodniach roboczych od zrealizowanych wzrostów wydajności przez Microsoft Excel. Jak wyszczególniono w tym dokumencie, NI DIAdem szybko się zwraca, pokonując ograniczenia programu Excel i wprowadzając dodatkowe narzędzia efektywności do zarządzania, analizowania i 160 raportowania danych pomiarowych. 160160 Tabela 2. DIAdem zwiększy Twoją wydajność, pokonując ograniczenia programu Microsoft Excel. 10. Dowiedz się więcej i przejdź do DIAdem już dziś Użyj poniższych zasobów, aby dowiedzieć się więcej o wyjściu poza Excela do bardziej zaawansowanych narzędzi do analizy danych pomiarowych i raportowania. Zobacz transmisję internetową podkreślającą korzyści systemu DIAdems w zakresie zarządzania danymi, analizy i raportowania. Obejrzyj sześć filmów 1-minutowych, aby dowiedzieć się więcej o DIAdem. Pobierz DIAdem i poznaj otoczenie za pomocą bezpłatnej, 7-dniowej oceny. Porozmawiaj z ekspertem, aby uzyskać bezpłatne demo internetowe lub natychmiast odpowiedz na pytania. Wykreśl analizę danych statystycznych To jest internetowa strona towarzysząca statystyk dotyczących biznesu USA Strona internetowa Para błędnych odwiedzin del mundo de habla hispana, este sitio se encuentra disponible en espaol en : Sitio Espejo para Amrica Latina Sitio de los EEUU Excel jest szeroko stosowanym pakietem statystycznym, który służy jako narzędzie do zrozumienia pojęć statystycznych i obliczeń w celu sprawdzenia obliczeń wykonywanych ręcznie w rozwiązywaniu problemów z pracą domową. Witryna stanowi wprowadzenie do zrozumienia podstaw i pracy z programem Excel. Ponowne zilustrowanie przykładowych przykładów liczbowych na tej stronie pomoże poprawić znajomość, a co za tym idzie zwiększyć efektywność i wydajność procesu w statystykach. Aby przeszukać witrynę. spróbuj E dit F ind na stronie Ctrl f. Wprowadź słowo lub frazę w oknie dialogowym, np. quot variancequot lub quot meanquot Jeśli pierwsze pojawienie się słowa nie jest tym, czego szukasz, spróbuj F ind Next. Wprowadzenie Ta strona zawiera przykładowe doświadczenie w korzystaniu z Excela w celu podsumowania danych, prezentacji i innych podstawowych analiz statystycznych. Uważam, że popularne korzystanie z programu Excel jest w obszarach, w których Excel naprawdę może się doskonalić. Obejmuje to organizowanie danych, tj. Podstawowe zarządzanie danymi, tabulację i grafikę. Aby uzyskać prawdziwą analizę statystyczną, należy się uczyć, korzystając z profesjonalnych komercyjnych pakietów statystycznych, takich jak SAS i SPSS. Microsoft Excel 2000 (wersja 9) udostępnia zestaw narzędzi do analizy danych o nazwie Analysis ToolPak, których można użyć do zapisywania kroków podczas opracowywania złożonych analiz statystycznych. Podajesz dane i parametry dla każdej analizy, w której narzędzie wykorzystuje odpowiednie statystyczne funkcje makr, a następnie wyświetla wyniki w tabeli wyników. Niektóre narzędzia generują wykresy oprócz tabel wyjściowych. Jeśli polecenie Analiza danych można wybrać w menu Narzędzia, pakiet narzędzi Analysis Tool jest zainstalowany w systemie. Jeśli jednak polecenie Analiza danych nie znajduje się w menu Narzędzia, należy zainstalować pakiet Analysis ToolPak, wykonując następujące czynności: Krok 1: W menu Narzędzia kliknij opcję Dodatki. Jeśli dodatku Analysis ToolPak nie ma na liście w oknie dialogowym Dodatki, kliknij przycisk Przeglądaj i znajdź dysk, nazwę folderu i nazwę pliku Analysis Analyst dodatku Add-in. xll zwykle znajduje się w folderze Program FilesMicrosoft OfficeOfficeLibraryAnalysis. Po znalezieniu pliku wybierz go i kliknij OK. Krok 2: Jeśli nie znajdziesz pliku Analys32.xll, musisz go zainstalować. Włóż dysk Microsoft Office 2000 Disk 1 do napędu CD-ROM. Wybierz polecenie Uruchom z menu Start systemu Windows. Przeglądaj i wybierz dysk CD. Wybierz Setup. exe, kliknij Otwórz i kliknij OK. Kliknij przycisk Dodaj lub usuń funkcje. Kliknij przycisk obok programu Microsoft Excel dla systemu Windows. Kliknij przycisk obok opcji Dodatki. Kliknij strzałkę w dół obok Analysis ToolPak. Wybierz opcję Uruchom z mojego komputera. Wybierz przycisk Aktualizuj teraz. Program Excel zaktualizuje teraz system, dodając Analysis ToolPak. Uruchom program Excel. W menu Narzędzia kliknij Dodatki. - i zaznacz pole wyboru Analysis ToolPak. Krok 3: Dodatek Analysis ToolPak jest teraz zainstalowany i Analiza danych. będzie można teraz wybrać w menu Narzędzia. Microsoft Excel to potężny pakiet arkuszy kalkulacyjnych dostępny dla systemów Microsoft Windows i Apple Macintosh. Oprogramowanie arkusza kalkulacyjnego służy do przechowywania informacji w kolumnach i wierszach, które następnie mogą być porządkowane i przetwarzane. Arkusze kalkulacyjne są zaprojektowane tak, aby dobrze działały z liczbami, ale często zawierają tekst. Excel organizuje pracę w skoroszytach, każdy skoroszyt może zawierać wiele arkuszy roboczych, które służą do wyświetlania i analizy danych. Program Excel jest dostępny na wszystkich komputerach publicznych (tj. W bibliotekach i komputerach PC). Można go otworzyć wybierając Start - Programy - Microsoft Excel lub klikając skrót Excel, który znajduje się na pulpicie lub na dowolnym komputerze PC lub pasku narzędzi Office. Otwieranie dokumentu: Kliknij Otwórz plik (CtrlO), aby otworzyć istniejący skoroszyt, zmień obszar katalogu lub wybierz pliki w innych lokalizacjach Aby utworzyć nowy skoroszyt, kliknij Plik-Nowy-pusty dokument. Zapisywanie i zamykanie dokumentu: Aby zapisać dokument z jego bieżącą nazwą pliku, lokalizacją i formatem pliku, kliknij Plik - Zapisz. Jeśli zapisujesz po raz pierwszy, kliknij Plik-Zapisz wybierztyp dokumentu, a następnie kliknij OK. Użyj również opcji Zapisz plik, jeśli chcesz zapisać do innej struktury plików. Po zakończeniu pracy nad dokumentem należy go zamknąć. Przejdź do menu Plik i kliknij Zamknij. Jeśli wprowadziłeś jakieś zmiany od ostatniego zapisania pliku, zostaniesz zapytany, czy chcesz je zapisać. Ekran programu Excel Skoroszyty i arkusze kalkulacyjne: Po uruchomieniu programu Excel wyświetlany jest pusty arkusz roboczy, który składa się z wielu siatek komórek z ponumerowanymi wierszami w dół strony i kolumnami z alfabetycznie zatytułowanymi na całej stronie. Do każdej komórki odwołują się jej współrzędne (na przykład A3 stosuje się w odniesieniu do komórki w kolumnie A, a wiersz 3 B10: B20 stosuje się w odniesieniu do zakresu komórek w kolumnie B i wierszach od 10 do 20). Twoja praca jest przechowywana w pliku Excel zwanym skoroszycie. Każdy skoroszyt może zawierać kilka arkuszy roboczych i wykresów - bieżący arkusz nazywa się aktywnym arkuszem. Aby wyświetlić inny arkusz roboczy w skoroszycie, kliknij odpowiednią kartę Arkusz. Możesz uzyskać dostęp i wykonywać polecenia bezpośrednio z menu głównego lub możesz wskazać jeden z przycisków paska narzędzi (pole wyświetlania, które pojawia się pod przyciskiem, kiedy umieścisz na nim kursor, wskazuje nazwę akcji przycisku) i kliknij raz. Poruszanie się po arkuszu roboczym: Ważne jest, aby móc efektywnie poruszać się po arkuszu roboczym, ponieważ można wprowadzać lub zmieniać dane jedynie w pozycji kursora. Możesz przesuwać kursor za pomocą klawiszy strzałek lub przesuwając mysz do żądanej komórki i klikając. Po wybraniu komórka staje się aktywną komórką i jest identyfikowana przez grubą granicę tylko jedna komórka może być aktywna jednocześnie. Aby przejść z jednego arkusza do drugiego, kliknij zakładki arkusza. (Jeśli skoroszyt zawiera wiele arkuszy, kliknij prawym przyciskiem myszy przyciski przewijania tabulatora, a następnie kliknij odpowiedni arkusz). Nazwa aktywnego arkusza jest pogrubiona. Przenoszenie między komórkami: Oto skróty klawiaturowe, aby przenieść aktywną komórkę: Strona główna - przenosi się do pierwszej kolumny w bieżącym wierszu CtrlHome - przenosi do lewego górnego rogu dokumentu Koniec, a następnie Strona główna - przenosi do ostatniej komórki w dokumencie Do poruszaj się między komórkami w arkuszu, kliknij dowolną komórkę lub użyj klawiszy strzałek. Aby zobaczyć inny obszar arkusza, użyj pasków przewijania i kliknij strzałki lub obszar powyżej pola przewijania w pionowym lub poziomym pasku przewijania. Zwróć uwagę, że rozmiar pola przewijania wskazuje proporcjonalną wielkość użytego obszaru arkusza widocznego w oknie. Pozycja okna przewijania wskazuje względne położenie widocznego obszaru w arkuszu. Wprowadzanie danych Nowy arkusz roboczy to siatka wierszy i kolumn. Wiersze są oznaczone numerami, a kolumny są oznaczone literami. Każde przecięcie wiersza i kolumny jest komórką. Każda komórka ma adres. która jest literą kolumny i numerem wiersza. Strzałka w arkuszu po prawej stronie wskazuje na komórkę A1, która jest obecnie podświetlona. wskazując, że jest to aktywna komórka. Komórka musi być aktywna, aby wprowadzić do niej informacje. Aby podświetlić (wybrać) komórkę, kliknij ją. Aby wybrać więcej niż jedną komórkę: kliknij komórkę (na przykład A1), a następnie przytrzymaj klawisz Shift, a następnie kliknij drugą (np. D4), aby zaznaczyć wszystkie komórki między A1 i D4 włącznie. Kliknij komórkę (np. A1) i przeciągnij myszą w pożądanym zakresie, odkreślając na innej komórce (np. D4), aby zaznaczyć wszystkie komórki pomiędzy A1 i D4 włącznie. Aby wybrać kilka komórek, które nie sąsiadują, naciśnij control i kliknij komórki, które chcesz wybrać. Kliknij liczbę lub literę oznaczającą rząd lub kolumnę, aby zaznaczyć cały wiersz lub kolumnę. Jeden arkusz może zawierać do 256 kolumn i 65 536 wierszy, więc upłynie trochę czasu, zanim zabraknie miejsca. Każda komórka może zawierać etykietę. wartość. wartość logiczna. lub formuła. Etykiety mogą zawierać dowolną kombinację liter, cyfr lub symboli. Wartości to liczby. W obliczeniach można stosować tylko wartości (liczby). Wartość może być również wartością daty lub czasuLogiczne wartości to prawda lub fałsz. Formuły automatycznie wykonują obliczenia na wartościach w innych określonych komórkach i wyświetlają wynik w komórce, w której wprowadzono formułę (na przykład można określić komórkę D3 ma zawierać sumę liczb w B3 i C3, liczba wyświetlana w D3 będzie funkcją liczb wprowadzonych do B3 i C3). Aby wprowadzić informacje do komórki, zaznacz komórkę i zacznij pisać. Pamiętaj, że podczas wpisywania informacji w komórce wprowadzone informacje są wyświetlane również na pasku formuły. Możesz również wprowadzić informacje do paska formuły, a informacje pojawią się w zaznaczonej komórce. Po zakończeniu wprowadzania etykiety lub wartości: naciśnij klawisz Enter, aby przejść do następnej komórki poniżej (w tym przypadku A2) Naciśnij klawisz Tab, aby przejść do następnej komórki po prawej stronie (w tym przypadku B1) Kliknij dowolną komórkę, aby wybrać Wprowadzanie etykiet Dopóki wprowadzone informacje nie zostaną sformatowane jako wartości lub formuły, program Excel zinterpretuje je jako etykietę i domyślnie wyrówna tekst po lewej stronie komórki. Jeśli tworzysz długi arkusz, a będziesz powtarzać te same informacje o etykietach w wielu różnych komórkach, możesz skorzystać z funkcji Autouzupełniania. Ta funkcja obejrzy inne wpisy w tej samej kolumnie i spróbuje dopasować poprzedni wpis do bieżącego wpisu. Na przykład, jeśli już wpisałeś Wesleyana w innej komórce i wpiszesz W w nowej komórce, Excel automatycznie przejdzie do Wesleyan. Jeśli chcesz wpisać Wesleyana do komórki, zadanie zostanie wykonane i możesz przejść do następnej komórki. Jeśli chcesz wpisać coś innego, np. Williams, do komórki, po prostu kontynuuj pisanie, aby wprowadzić termin. Aby włączyć funkcję AutoComplete, kliknij Narzędzia na pasku menu, a następnie wybierz Opcje, a następnie wybierz Edytuj i kliknij, aby zaznaczyć pole w polu Włącz autouzupełnianie dla wartości komórek. Innym sposobem szybkiego wprowadzania powtarzających się etykiet jest użycie funkcji Wybierz listę. Kliknij prawym przyciskiem myszy komórkę, a następnie wybierz opcję Wybierz z listy. To da ci menu z wszystkimi innymi wpisami w komórkach w tej kolumnie. Kliknij pozycję w menu, aby wprowadzić ją do aktualnie wybranej komórki. Wartość to liczba, data lub czas plus kilka symboli, jeśli jest to konieczne, w celu dalszego zdefiniowania liczb takich jak. - () 93. Zakłada się, że liczby są dodatnie, aby wprowadzić liczbę ujemną, użyć znaku minus - lub ująć liczbę w nawiasach (). Daty są przechowywane jako MMDDYYYY, ale nie musisz wprowadzać go dokładnie w tym formacie. Jeśli wprowadzisz jan 9 lub jan-9, program Excel rozpozna go na 9 stycznia bieżącego roku i zapisze go jako 192002. Wprowadź czterocyfrowy rok na rok inny niż bieżący (np. 9 stycznia 1999 r.). Aby wprowadzić aktualną datę dni, naciśnij przycisk sterowania i jednocześnie. Czas domyślnie ustawiony na zegar 24-godzinny. Użyj a lub p, aby wskazać am lub pm, jeśli używasz zegara 12-godzinnego (np. 8:30 p jest interpretowane jako 20:30). Aby wprowadzić aktualny czas, naciśnij jednocześnie przyciski sterowania i: (shift-średnik). Wpis interpretowany jako wartość (numer, data lub godzina) jest wyrównany do prawej strony komórki, aby ponownie sformatować wartość. Zaokrąglanie liczb spełniających określone kryteria: Aby zastosować kolory do maksymalnych i minimalnych wartości: Wybierz komórkę w regionie i naciśnij CtrlShift (w programie Excel 2003, naciśnij ten lub CtrlA), aby wybrać bieżący region. Z menu Format wybierz Formatowanie warunkowe. W Warunku 1 wybierz Formuła jest i wpisz MAX (F: F) F1. Kliknij przycisk Formatuj, wybierz kartę Czcionka, wybierz kolor, a następnie kliknij przycisk OK. W Warunku 2 wybierz Formuła Is i wpisz MIN (F: F) F1. Powtórz krok 4, wybierz inny kolor niż wybrany dla warunku 1, a następnie kliknij przycisk OK. Uwaga: Należy pamiętać o rozróżnianiu referencji bezwzględnej od względnej podczas wprowadzania wzorów. Numery wywołujące, które spełniają określone kryteria Problem: Zaokrąglanie wszystkich liczb w kolumnie A do zera miejsc dziesiętnych, z wyjątkiem tych, które mają 5 w pierwszym miejscu po przecinku. Rozwiązanie: Użyj funkcji IF, MOD i ROUND w następującym wzorze: JEŻELI (MOD (A2,1) 0,5, A2, ROUND (A2,0)) Aby skopiować i wkleić wszystkie komórki w arkuszu Zaznacz komórki w arkuszu naciskając CtrlA (w programie Excel 2003, wybierz komórkę w pustym obszarze przed naciśnięciem CtrlA lub z wybranej komórki z zakresu Bieżący wiersz danych, naciśnij CtrlAA). LUB Kliknij opcję Zaznacz wszystko w lewym górnym przecięciu wierszy i kolumn. Naciśnij CtrlC. Naciśnij CtrlPage w dół, aby wybrać inny arkusz, a następnie wybierz komórkę A1. Naciśnij enter. Kopiowanie całego arkusza Kopiowanie całego arkusza oznacza kopiowanie komórek, parametrów konfiguracji strony i zdefiniowanych nazw zakresów. Opcja 1: Przesuń wskaźnik myszy na kartę arkusza. Naciśnij Ctrl i przytrzymaj mysz, aby przeciągnąć arkusz do innej lokalizacji. Zwolnij przycisk myszy i klawisz Ctrl. Opcja 2: Kliknij prawym przyciskiem myszy odpowiednią kartę arkusza. Z menu podręcznego wybierz Przenieś lub Kopiuj. Okno dialogowe Przesuń lub Kopiuj umożliwia skopiowanie arkusza do innej lokalizacji w bieżącym skoroszycie lub do innego skoroszytu. Zaznacz pole wyboru Utwórz kopię. Opcja 3: Z menu Okno wybierz Rozmieść. Wybierz opcję Kafelki, aby wstawić wszystkie otwarte skoroszyty w oknie. Użyj opcji 1 (przeciągając arkusz, naciskając jednocześnie Ctrl), aby skopiować lub przesunąć arkusz. Sortowanie według kolumn Domyślnym ustawieniem sortowania w porządku rosnącym lub malejącym jest wiersz. Aby sortować według kolumn: Z menu Dane wybierz Sortuj, a następnie Opcje. Wybierz opcję Sortuj od lewej do prawej i kliknij OK. W opcji Sortuj według okna dialogowego Sortuj wybierz numer wiersza, według którego zostaną posortowane kolumny, a następnie kliknij przycisk OK. Statystyki opisowe Narzędzie do analizy danych zawiera narzędzie Statystyka opisowa, które zapewnia łatwy sposób obliczania zbiorczych statystyk dla zestawu przykładowych danych. Statystyki podsumowujące obejmują średnią, błąd standardowy, medianę, tryb, odchylenie standardowe, wariancję, kurtozę, pochylenie, zakres, minimum, maksimum, sumę i liczbę. To narzędzie eliminuje potrzebę wpisywania poszczególnych funkcji, aby znaleźć każdy z tych wyników. Excel zawiera rozbudowane i modyfikowalne paski narzędzi, na przykład standardowy pasek narzędzi pokazany tutaj: Niektóre ikony są użyteczne obliczenia matematyczne: jest ikona Autosum, która wprowadza formułę sum (), aby dodać zakres komórek. jest ikoną FunctionWizard, która zapewnia dostęp do wszystkich dostępnych funkcji. jest ikoną GraphWizard, umożliwiającą dostęp do wszystkich dostępnych typów wykresów, jak pokazano na tym ekranie: Program Excel może być używany do generowania pomiarów położenia i zmienności dla zmiennej. Załóżmy, że chcemy znaleźć statystyki opisowe dla przykładowych danych: 2, 4, 6 i 8. Krok 1. Wybierz rozwijane menu Narzędzia, jeśli widzisz analizę danych, kliknij tę opcję, w przeciwnym razie kliknij na dodatek . opcja instalacji narzędzia do analizy pak. Krok 2. Kliknij opcję analizy danych. Krok 3. Wybierz Statystyki opisowe z listy Narzędzia analityczne. Krok 4. Kiedy pojawi się okno dialogowe: Wprowadź A1: A4 w polu zakresu wejściowego, A1 jest wartością w kolumnie A i wierszu 1. w tym przypadku ta wartość wynosi 2. Korzystając z tej samej techniki, wprowadź inne wartości, aż dotrzesz do ostatniego. Jeśli próbka składa się z 20 liczb, możesz wybrać np. A1, A2, A3 itd. Jako zakres wejściowy. Krok 5. Wybierz zakres wyjściowy. w tym przypadku B1. Kliknij statystyki podsumowania, aby zobaczyć wyniki. Po kliknięciu przycisku OK. zobaczysz wynik w wybranym zakresie. Jak widać, średnia próbki wynosi 5, mediana 5, odchylenie standardowe 2,581989, wariancja próbki 6,666667, zakres 6 i tak dalej. Każdy z tych czynników może być ważny przy obliczaniu różnych procedur statystycznych. Rozkład normalny Zastanów się nad problemem znalezienia prawdopodobieństwa uzyskania mniejszej wartości niż pod jakimkolwiek normalnym rozkładem prawdopodobieństwa. Jako przykładowy przykład załóżmy, że wyniki SAT w całym kraju są zwykle dystrybuowane ze średnią i odchyleniem standardowym odpowiednio 500 i 100. Odpowiedz na następujące pytania na podstawie podanych informacji: A: Jakie jest prawdopodobieństwo, że losowo wybrany wynik ucznia będzie mniejszy niż 600 punktów B: Jakie jest prawdopodobieństwo, że losowo wybrany wynik ucznia przekroczy 600 punktów C: Jakie jest prawdopodobieństwo że losowo wybrany wynik ucznia będzie wynosił od 400 do 600 Wskazówka: przy pomocy Excela możesz znaleźć prawdopodobieństwo otrzymania wartości mniejszej lub równej podanej wartości. W przypadku problemu, gdy podano średnią i standardowe odchylenie populacji, musisz użyć zdrowego rozsądku, aby znaleźć różne prawdopodobieństwa na podstawie pytania, ponieważ wiesz, że obszar pod normalną krzywą wynosi 1. W arkuszu roboczym wybierz komórka, w której chcesz, aby pojawiła się odpowiedź. Załóżmy, że wybrałeś komórkę numer jeden, A1. Z menu wybierz polecenieininsert pull-downquot. Kroki 2-3 Z menu wybierz opcję wstawiania, a następnie kliknij opcję Funkcja. Krok 4. Po kliknięciu opcji Funkcja pojawi się okno dialogowe Wklej funkcja z kategorii funkcji. Wybierz opcję Statystyka, a następnie opcję ROZKŁAD. NORMALNY w polu Nazwa funkcji Kliknij przycisk OK. Krok 5. Po kliknięciu przycisku OK zostanie wyświetlone okno dystrybucji NORMDIST: i. Wprowadź 600 w X (pole wartości) ii. Wprowadź 500 w polu Średnia iii. Wprowadź 100 w polu odchylenia standardowego iv. Wpisz quottruequot w polu skumulowanym, a następnie kliknij przycisk OK. Jak widać wartość 0.84134474 pojawia się w A1, wskazując prawdopodobieństwo, że losowo wybrany wynik uczniów jest poniżej 600 punktów. Używając zdrowego rozsądku możemy odpowiedzieć na część quotbquot, odejmując 0,84134474 od 1. Tak więc część quototwytwa odpowiedzi to 1- 0,8413474 lub 0,158653. Jest to prawdopodobieństwo, że losowo wybrany wynik uczniów jest większy niż 600 punktów. Aby odpowiedzieć na część quotququot, użyj tych samych technik, aby znaleźć prawdopodobieństwo lub obszar po lewej stronie wartości 600 i 400. Ponieważ te obszary lub prawdopodobieństwa nakładają się na siebie, aby odpowiedzieć na pytanie, powinieneś odjąć mniejsze prawdopodobieństwo od większego prawdopodobieństwa. Odpowiedź wynosi 0,84134474 - 0,155865526 ​​czyli 0,68269. Zrzut ekranu powinien wyglądać następująco: Obliczanie wartości zmiennej losowej, często zwanej wartością quotxquot Można użyć NORMINV z pola funkcji, aby obliczyć wartość dla zmiennej losowej - jeśli podano prawdopodobieństwo po lewej stronie tej zmiennej. Właściwie powinieneś używać tej funkcji do obliczania różnych percentyle. W tym problemie można zapytać, jaka jest punktacja ucznia, którego percentyl wynosi 90. Oznacza to, że około 90 wyników uczniów jest mniejszych od tej liczby. Z drugiej strony, gdybyśmy zostali poproszeni o zrobienie tego problemu ręcznie, musielibyśmy obliczyć wartość x za pomocą formuły rozkładu normalnego x m ​​zd. Teraz pozwala używać programu Excel do obliczania P90. W oknie dialogowym Wklej kliknij okno dialogowe statystyczne, a następnie kliknij przycisk NORMINV. Zrzut ekranu wyglądałby tak: Po wyświetleniu komunikatu NORMINV pojawia się okno dialogowe. ja. Wprowadź 0,90 dla prawdopodobieństwa (oznacza to, że około 90 studentów punktów jest mniejszych niż wartość, której szukamy) ii. Wprowadź 500 dla średniej (jest to średnia rozkładu normalnego w naszym przypadku) iii. Wprowadź 100 dla odchylenia standardowego (jest to standardowe odchylenie rozkładu normalnego w naszym przypadku). Na końcu tego ekranu zobaczysz wynik formuły, który wynosi około 628 punktów. Oznacza to, że 10 najlepszych uczniów uzyskało wynik lepszy niż 628. Przedział ufności dla Średniego Przypuszczenia, który chcemy oszacować przedział ufności dla średniej populacji. W zależności od wielkości próbki można użyć jednego z następujących przypadków: Duża wielkość próbki (n jest większa niż, na przykład 30): Ogólna formuła dla określenia przedziału ufności dla populacji oznacza: W tym wzorze jest średnia próbki Z jest współczynnikiem przedziału, który można znaleźć na podstawie normalnej tabeli rozkładu (na przykład współczynnik przedziału dla 95 poziomu ufności wynosi 1,96). S jest odchyleniem standardowym próbki, a n jest wielkością próbki. Teraz chcielibyśmy pokazać, w jaki sposób Excel jest wykorzystywany do opracowania pewnego przedziału ufności średniej populacji na podstawie przykładowej informacji. Jak widzisz, aby ocenić tę formułę, potrzebujesz średniej z próbki i marginesu błędu Excel automatycznie obliczy te ilości dla ciebie. Jedyne, co musisz zrobić, to: dodać margines błędu do średniej próbki, znaleźć górną granicę przedziału i odjąć margines błędu od średniej do dolnej granicy przedziału. Aby zademonstrować, w jaki sposób Excel znajdzie te ilości, użyjemy zestawu danych, który zawiera dochód godzinowy 36 studentów studiów doktoranckich tutaj, na Uniwersytecie w Baltimore. Numery te pojawiają się w komórkach od A1 do A36 na arkuszu roboczym programu Excel. Po wprowadzeniu danych postępowaliśmy zgodnie z opisową procedurą statystyczną, aby obliczyć nieznane ilości. Jedynym dodatkowym krokiem jest kliknięcie przedziału ufności w oknie dialogowym statystyki opisowej i wpisanie podanego poziomu ufności, w tym przypadku 95. Oto powyższe procedury krok po kroku: Krok 1. Wprowadzanie danych do komórek A1 do A36 (w arkuszu kalkulacyjnym) Krok 2. Z menu wybierz Narzędzia Krok 3. Kliknij Analiza danych, następnie wybierz opcję Statystyka opisowa, a następnie kliknij OK. W oknie dialogowym statystyki opisowej kliknij pozycję Statystyka podsumowania. Po wykonaniu tej czynności kliknij poziom przedziału ufności i wpisz 95 - lub w innych problemach o dowolnym przedziale ufności. W polu Output Range wpisz B1 lub dowolną żądaną lokalizację. Teraz kliknij OK. Zrzut ekranu wygląda następująco: jak widać, arkusz kalkulacyjny pokazuje, że średnia próbki wynosi 6.902777778, a wartość bezwzględna marginesu błędu wynosi 0,231678109. Średnia ta jest oparta na tej przykładowej informacji. 95 przedział ufności dla godzinowego dochodu studentów UB z pracy ma górny limit 6.902777778 0.231678109 i niższy limit 6.902777778 - 0.231678109. Z drugiej strony możemy powiedzieć, że ze wszystkich tak utworzonych przedziałów 95 zawiera średnią populacji. Lub, z przyczyn praktycznych, możemy być pewni, że średnia populacji wynosi między 6.902777778 - 0.231678109 i 6.902777778 0.231678109. Możemy mieć co najmniej 95 pewności, że przedział 6,68 i 7,13 zawiera średni godzinny dochód studenta do pracy. Smal Wielkość próby (powiedzmy mniej niż 30) Jeśli próbka n jest mniejsza niż 30 lub musimy użyć procedury małej próbki, aby wytworzyć przedział ufności dla średniej populacji. Ogólny wzór do opracowania przedziałów ufności dla średniej populacji na podstawie małej próbki wynosi: W tym wzorze jest średnia próbki. jest współczynnikiem przedziału zapewniającym obszar w górnym ogonie rozkładu t przy n-1 stopniach swobody, które można znaleźć z tablicy rozkładu t (na przykład współczynnik przedziałowy dla poziomu ufności 90 wynosi 1,833, jeśli próbka ma 10). S jest odchyleniem standardowym próbki, a n jest wielkością próbki. Teraz chciałbyś zobaczyć, w jaki sposób Excel jest wykorzystywany do opracowania pewnego przedziału ufności średniej populacji na podstawie tej małej próbki informacji. Jak widzisz, aby ocenić tę formułę, potrzebujesz średniej z próbki i marginesu błędu Excel automatycznie obliczy te wielkości w taki sam sposób, jak w przypadku dużych próbek. Ponownie, jedyne co musisz zrobić, to: dodać margines błędu do średniej próbki, znaleźć górny limit przedziału i odjąć margines błędu od średniej, aby znaleźć dolny limit przedziału. Aby zademonstrować, w jaki sposób Excel znajdzie te ilości, użyjemy zestawu danych, który zawiera godzinowe dochody 10 studentów studiów doktoranckich tutaj, na Uniwersytecie w Baltimore. Numery te pojawiają się w komórkach od A1 do A10 na arkuszu roboczym programu Excel. Po wprowadzeniu danych postępujemy zgodnie z opisową procedurą statystyczną, aby obliczyć nieznane ilości (dokładnie tak, jak znaleźliśmy ilości dla dużej próbki). Tutaj są procedury w formie krok po kroku: Krok 1. Wprowadź dane w komórkach A1 do A10 w arkuszu kalkulacyjnym Krok 2. Z menu wybierz Narzędzia Krok 3. Kliknij Analiza danych, a następnie wybierz opcję Statystyka opisowa. Kliknij przycisk OK w oknie dialogowym statystyki opisowej, kliknij opcję Statystyka podsumowania, kliknij poziom przedziału ufności i wpisz 90 lub inne problemy, w zależności od pożądanego przedziału ufności. W polu Output Range wpisz B1 lub dowolną żądaną lokalizację. Teraz kliknij OK. Zrzut ekranu będzie wyglądał następująco: Teraz, podobnie jak przy obliczaniu przedziału ufności dla dużej próbki, oblicz przedział ufności populacji na podstawie tej małej próbki informacji. Przedział ufności wynosi: 6,8 0,414426102 lub 6,39 7,21. Możemy mieć co najmniej 90 powierników, że przedział 6.39 i 7.21 zawiera rzeczywistą średnią populacji. Test hipotez dotyczących populacji Ponownie, musimy rozróżnić dwa przypadki w odniesieniu do wielkości próbki Duży rozmiar próbki (powiedzmy, powyżej 30): W tej sekcji chcesz wiedzieć, w jaki sposób Excel może być użyty do przeprowadzenia testu hipotezy o średnia populacji. Będziemy wykorzystywać godzinowe dochody różnych studentów do nauki w miejscu pracy, niż te wprowadzone wcześniej w sekcji przedziału ufności. Dane wprowadza się w komórkach od A1 do A36. Celem jest przetestowanie następującej hipotezy zerowej i alternatywnej: Hipoteza zerowa wskazuje, że średni godzinny dochód studenta z pracy jest równy 7 na godzinę, jednak alternatywna hipoteza wskazuje, że średni godzinny dochód nie jest równy 7 na godzina. Powtórzę kroki podjęte w statystykach opisowych i na samym końcu pokażę, jak znaleźć wartość statystyki testu w tym przypadku, z, używając formuły komórki. Krok 1. Wprowadź dane w komórkach od A1 do A36 (w arkuszu kalkulacyjnym) Krok 2. Z menu wybierz Narzędzia Krok 3. Kliknij Analiza danych, następnie wybierz opcję Statystyka opisowa, kliknij OK. W oknie dialogowym statystyki opisowej kliknij pozycję Statystyka podsumowania. Wybierz pole Output Range, wpisz B1 lub dowolną żądaną lokalizację. Teraz kliknij OK. (Aby obliczyć wartość statystyki testowej, wyszukaj średnią próbki, a następnie błąd standardowy. W tym wyjściu wartości te znajdują się w komórkach C3 i C4.) Krok 4. Wybierz komórkę D1 i wprowadź formułę komórki (C3 - 7 ) C4. Zrzut ekranu powinien wyglądać następująco: Wartość w komórce D1 jest wartością statystyki testu. Ponieważ ta wartość spada w zakresie akceptacji od -1.96 do 1.96 (z normalnej tabeli dystrybucji), nie odrzucamy hipotezy zerowej. Mały rozmiar próbki (na przykład mniej niż 30): Używając podjętych kroków w przypadku dużej próbki, program Excel może posłużyć do przeprowadzenia hipotezy dotyczącej przypadku małej próbki. Użyjmy godzinowego dochodu 10 studentów do pracy na UB, aby przeprowadzić następującą hipotezę. Hipoteza zerowa wskazuje, że średni godzinny dochód studenta z pracy wynosi 7 na godzinę. Alternatywna hipoteza wskazuje, że średni godzinny dochód nie jest równy 7 na godzinę. Powtórzę kroki podjęte w statystykach opisowych i na samym końcu pokażę, jak znaleźć wartość statystyk testowych w tym przypadku quottquot za pomocą formuły komórki. Krok 1. Wprowadź dane w komórkach od A1 do A10 (w arkuszu kalkulacyjnym) Krok 2. Z menu wybierz Narzędzia Krok 3. Kliknij Analiza danych, a następnie wybierz opcję Statystyka opisowa. Kliknij OK. W oknie dialogowym statystyki opisowej kliknij pozycję Statystyka podsumowania. Wybierz pola Output Range, wpisz B1 lub dowolną wybraną lokalizację. Ponownie kliknij OK. (Aby obliczyć wartość statystyk testowych w poszukiwaniu średniej próbki, następnie błąd standardowy, na tym wyjściu wartości te znajdują się w komórkach C3 i C4.) Krok 4. Wybierz komórkę D1 i wprowadź formułę komórki (C3 - 7) C4. Zrzut ekranu wyglądałby następująco: Ponieważ wartość statystyki testowej t -0,66896 mieści się w zakresie akceptacji -2.262 do 2.262 (z tabeli t, gdzie 0.025 i stopni swobody wynosi 9), nie odrzucamy hipotezy zerowej. Różnica między średnią dwóch populacji W tej sekcji pokażemy, w jaki sposób Excel jest używany do przeprowadzenia testu hipotez dotyczących różnicy między dwiema populacjami, czyli przy założeniu, że populacje mają równe wariancje. Dane w tym przypadku pochodzą z różnych biur na Uniwersytecie w Baltimore. Zebrałem dane o dochodach godzinowych 36 losowo wybranych studentów studiów doktoranckich i 36 asystentów. Zakres godzinowy dla studentów studiów doktoranckich wynosił 6 - 8, a zakres godzinowy dla asystentów wynosił 6-9. Głównym celem tego badania hipotezy jest sprawdzenie, czy istnieje znacząca różnica między środkami obu populacji. Hipoteza NULL i ALTERNATYWNA jest taka, że ​​środki są równe i środki nie są równe, odpowiednio. Nawiązując do arkusza kalkulacyjnego, wybrałem A1 i A2 jako centra etykiet. Dochód godzinowy studiujących pracę dla próbki o rozmiarze 36 przedstawiono w komórkach A2: A37. a dochód godzinowy asystenta dla próbki o rozmiarze 36 jest pokazany w komórkach B2: B37 Dane do pracy Studenci Student: 6, 6, 6, 6, 6, 6, 6, 6,5, 6,5, 6,5, 6,5, 6,5, 6,5, 7, 7, 7, 7, 7, 7, 7, 7,5, 7,5, 7,5, 7,5, 7,5, 7,5, 8, 8, 8, 8, 8, 8, 8, 8, 8. Dane dla asystenta studenta: 6 6, 6, 6, 6, 6,5, 6,5, 6,5, 6,5, 6,5, 7, 7, 7, 7, 7, 7,5, 7,5, 7,5, 7,5, 7,5, 7,5, 8, 8, 8, 8, 8 , 8, 8, 8,5, 8,5, 8,5, 8,5, 8,5, 9, 9, 9, 9. Użyj procedury Statystyka opisowa, aby obliczyć wariancje dwóch próbek. Procedura Excel do testowania różnicy między dwoma populacjami oznacza wymaganie informacji na temat wariancji dwóch populacji. Ponieważ wariancje dwóch populacji są nieznane, należy je zastąpić wariancjami próbki. Opisowe dla obu próbek pokazują, że wariancja pierwszej próbki wynosi s 1 2 0,55546218. natomiast wariancja drugiej próbki s 2 2 0,969748. Aby przeprowadzić wymaganą hipotezę testu za pomocą programu Excel, można wykonać następujące kroki: Krok 1. Z menu wybierz Narzędzia, a następnie kliknij opcję Analiza danych. Step 2. When the Data Analysis dialog box appears: Choose z-Test: Two Sample for means then click OK Step 3. When the z-Test: Two Sample for means dialog box appears: Enter A1:A36 in the variable 1 range box (work-study students hourly income) Enter B1:B36 in the variable 2 range box (student assistants hourly income) Enter 0 in the Hypothesis Mean Difference box (if you desire to test a mean difference other than 0, enter that value) Enter the variance of the first sample in the Variable 1 Variance box Enter the variance of the second sample in the Variable 2 Variance box and select Labels Enter 0.05 or, whatever level of significance you desire, in the Alpha box Select a suitable Output Range for the results, I chose C19 . then click OK. The value of test statistic z-1.9845824 appears in our case in cell D24. The rejection rule for this test is z 1.96 from the normal distribution table. In the Excel output these values for a two-tail test are z 1.959961082. Since the value of the test statistic z-1.9845824 is less than -1.959961082 we reject the null hypothesis. We can also draw this conclusion by comparing the p-value for a two tail - test and the alpha value. Since p-value 0.047190813 is less than a0.05 we reject the null hypothesis. Overall we can say, based on the sample results, the two populations means are different. Small Samples: n 1 OR n 2 are less than 30 In this section we will show how Excel is used to conduct a hypothesis test about the difference between two population means. - Given that the populations have equal variances when two small independent samples are taken from both populations. Similar to the above case, the data in this case are taken from various offices here at the University of Baltimore. I collected hourly income data of 11 randomly selected work-study students and 11 randomly selected student assistants. The hourly income range for both groups was similar range, 6 - 8 and 6-9. The main objective in this hypothesis testing is similar too, to see whether there is a significant difference between the means of the two populations. The NULL and the ALTERNATIVE hypothesis are that the means are equal and they are not equal, respectively. Referring to the spreadsheet, we chose A1 and A2 as label centers. The work-study students hourly income for a sample size 11 are shown in cells A2:A12 . and the student assistants hourly income for a sample size 11 is shown in cells B2:B12 . Unlike previous case, you do not have to calculate the variances of the two samples, Excel will automatically calculate these quantities and use them in the calculation of the value of the test statistic. Similar to the previous case, but a bit different in step 2, to conduct the desired test hypothesis with Excel the following steps can be taken: Step 1. From the menus select Tools then click on the Data Analysis option. Step 2. When the Data Analysis dialog box appears: Choose t-Test: Two Sample Assuming Equal Variances then click OK Step 3 When the t-Test: Two Sample Assuming Equal Variances dialog box appears : Enter A1:A12 in the variable 1 range box (work-study student hourly income) Enter B1:B12 in the variable 2 range box (student assistant hourly income) Enter 0 in the Hypothesis Mean Difference box(if you desire to test a mean difference other than zero, enter that value) then select Labels Enter 0.05 or, whatever level of significance you desire, in the Alpha box Select a suitable Output Range for the results, I chose C1, then click OK. The value of the test statistic t-1.362229828 appears, in our case, in cell D10. The rejection rule for this test is t 2.086 from the t distribution table where the t value is based on a t distribution with n 1 - n 2 -2 degrees of freedom and where the area of the upper one tail is 0.025 ( that is equal to alpha2). In the Excel output the values for a two-tail test are t 2.085962478. Since the value of the test statistic t-1.362229828, is in an acceptance range of t 2.085962478, we fail to reject the null hypothesis. We can also draw this conclusion by comparing the p-value for a two-tail test and the alpha value. Since the p-value 0.188271278 is greater than a0.05 again . we fail to reject the null hypothesis. Overall we can say, based on sample results, the two populations means are equal. Enter data in an Excel work sheet starting with cell A2 and ending with cell C8. The following steps should be taken to find the proper output for interpretation. Step 1. From the menus select Tools and click on Data Analysis option. Step 2. When data analysis dialog appears, choose Anova single-factor option enter A2:C8 in the input range box. Select labels in first row. Step3. Select any cell as output(in here we selected A11). Kliknij OK. The general form of Anova table looks like following: Source of Variation Suppose the test is done at level of significance a 0.05, we reject the null hypothesis. This means there is a significant difference between means of hourly incomes of student assistants in these departments. The Two-way ANOVA Without Replication In this section, the study involves six students who were offered different hourly wages in three different department services here at the University of Baltimore. The objective is to see whether the hourly incomes are the same. Therefore, we can consider the following: Treatment: Hourly payments in the three departments Blocks: Each student is a block since each student has worked in the three different departments The general form of Anova table would look like: Source of Variation Degrees of freedom To find the Excel output for the above data the following steps can be taken: Step 1. From the menus select Tools and click on Data Analysis option. Step2. When data analysis box appears: select Anova two-factor without replication then Enter A2: D8 in the input range. Select labels in first row. Step3. Select an output range (in here we selected A11) then OK. Source of Variation NOTE: FMSTMSE 0.9805560.497222 1.972067 F 3.33 from table (5 numerator DF and 10 denominator DF) Since 1.972067 Goodness-of-Fit Test for Discrete Random Variables The CHI-SQUARE distribution can be used in a hypothesis test involving a population variance. However, in this section we would like to test and see how close a sample results are to the expected results. Example: The Multinomial Random Variable In this example the objective is to see whether or not based on a randomly selected sample information the standards set for a population is met. There are so many practical examples that can be used in this situation. For example it is assumed the guidelines for hiring people with different ethnic background for the US government is set at 70(WHITE), 20(African American) and 10(others), respectively. A randomly selected sample of 1000 US employees shows the following results that is summarized in a table. EXPECTED NUMBER OF EMPLOYEES OBSERVED FROM SAMPLE As you see the observed sample numbers for groups two and three are lower than their expected values unlike group one which has a higher expected value. Is this a clear sign of discrimination with respect to ethnic background Well depends on how much lower the expected values are. The lower amount might not statistically be significant. To see whether these differences are significant we can use Excel and find the value of the CHI-SQUARE. If this value falls within the acceptance region we can assume that the guidelines are met otherwise they are not. Now lets enter these numbers into Excel spread - sheet. We used cells B7-B9 for the expected proportions, C7-C9 for the observed values and D7-D9 for the expected frequency. To calculate the expected frequency for a category, you can multiply the proportion of that category by the sample size (in here 1000). The formula for the first cell of the expected value column, D7 is 1000B7. To find other entries in the expected value column, use the copy and the paste menu as shown in the following picture. These are important values for the chi-square test. The observed range in this case is C7: C9 while the expected range is D7: D9. The null and the alternative hypothesis for this test are as follows: H A . The population proportions are not P W 0.70, P A 0.20 and P O 0.10 Now lets use Excel to calculate the p-value in a CHI-SQUARE test. Step 1. Select a cell in the work sheet, the location which you like the p value of the CHI-SQUARE to appear. We chose cell D12. Step 2. From the menus, select insert then click on the Function option, Paste Function dialog box appears. Step 3. Refer to function category box and choose statistical . from function name box select CHITEST and click on OK . Step 4. When the CHITEST dialog appears: Enter C7: C9 in the actual-range box then enter D7: D9 in the expected-range box, and finally click on OK . The p-value will appear in the selected cell, D12. As you see the p value is 0.002392 which is less than the value of the level of significance (in this case the level of significance, a 0.10). Hence the null hypothesis should be rejected. This means based on the sample information the guidelines are not met. Notice if you type CHITEST(C7:C9,D7:D9) in the formula bar the p-value will show up in the designated cell. NOTE: Excel can actually find the value of the CHI-SQUARE. To find this value first select an empty cell on the spread sheet then in the formula bar type CHIINV(D12,2). D12 designates the p-Value found previously and 2 is the degrees of freedom (number of rows minus one). The CHI-SQUARE value in this case is 12.07121. If we refer to the CHI-SQUARE table we will see that the cut off is 4.60517 since 12.071214.60517 we reject the null. The following screen shot shows you how to the CHI-SQUARE value. Test of Independence: Contingency Tables The CHI-SQUARE distribution is also used to test and see whether two variables are independent or not. For example based on sample data you might want to see whether smoking and gender are independent events for a certain population. The variables of interest in this case are smoking and the gender of an individual. Another example in this situation could involve the age range of an individual and his or her smoking habit. Similar to case one data may appear in a table but unlike the case one this table may contains several columns in addition to rows. The initial table contains the observed values. To find expected values for this table we set up another table similar to this one. To find the value of each cell in the new table we should multiply the sum of the cell column by the sum of the cell row and divide the results by the grand total. The grand total is the total number of observations in a study. Now based on the following table test whether or not the smoking habit and gender of the population that the following sample taken from are independent. On the other hand is that true that males in this population smoke more than females You could use formula bar to calculate the expected values for the expected range. For example to find the expected value for the cell C5 which is replaced in c11 you could click on the formula bar and enter C6D5D6 then enter in cell C11. Step 1. Observed Range b4:c5 Smoking and gender So the observed range is b4:c5 and the expected range is b10:c11. Step 3. Click on fx (paste function) Step 4. When Paste Function dialog box appears, click on Statistical in function category and CHITEST in the function name then click OK. When the CHITEST box appears, enter b4:c5 for the actual range, then b10:c11 for the expected range. Step 5. Click on OK (the p-value appears). 0.477395 Conclusion: Since p-value is greater than the level of significance (0.05), fails to reject the null. This means smoking and gender are independent events. Based on sample information one can not assure females smoke more than males or the other way around. Step 6. To find the chi-square value, use CHINV function, when Chinv box appears enter 0.477395 for probability part, then 1 for the degrees of freedom. Degrees of freedom(number of columns-1)X(number of rows-1) Test Hypothesis Concerning the Variance of Two Populations In this section we would like to examine whether or not the variances of two populations are equal. Whenever independent simple random samples of equal or different sizes such as n 1 and n 2 are taken from two normal distributions with equal variances, the sampling distribution of s 1 2 s 2 2 has F distribution with n 1 - 1 degrees of freedom for the numerator and n 2 - 1 degrees of freedom for the denominator. In the ratio s 1 2 s 2 2 the numerator s 1 2 and the denominator s 2 2 are variances of the first and the second sample, respectively. The following figure shows the graph of an F distribution with 10 degrees of freedom for both the numerator and the denominator. Unlike the normal distribution as you see the F distribution is not symmetric. The shape of an F distribution is positively skewed and depends on the degrees of freedom for the numerator and the denominator. The value of F is always positive. Now let see whether or not the variances of hourly income of student-assistant and work-study students based on samples taken from populations previously are equal. Assume that the hypothesis test in this case is conducted at a 0.10. The null and the alternative are: Rejection Rule: Reject the null hypothesis if Flt F 0.095 or Fgt F 0.05 where F, the value of the test statistic is equal to s 1 2 s 2 2. with 10 degrees of freedom for both the numerator and the denominator. We can find the value of F .05 from the F distribution table. If s 1 2 s 2 2. we do not need to know the value of F 0.095 otherwise, F 0.95 1 F 0.05 for equal sample sizes. A survey of eleven student-assistant and eleven work-study students shows the following descriptive statistics. Our objective is to find the value of s 1 2 s 2 2. where s 1 2 is the value of the variance of student assistant sample and s 2 2 is the value of the variance of the work study students sample. As you see these values are in cells F8 and D8 of the descriptive statistic output. To calculate the value of s 1 2 s 2 2. select a cell such as A16 and enter cell formula F8D8 and enter. This is the value of F in our problem. Since this value, F1.984615385, falls in acceptance area we fail to reject the null hypothesis. Hence, the sample results do support the conclusion that student assistants hourly income variance is equal to the work study students hourly income variance. The following screen shoot shows how to find the F value. We can follow the same format for one tail test(s). Linear Correlation and Regression Analysis In this section the objective is to see whether there is a correlation between two variables and to find a model that predicts one variable in terms of the other variable. There are so many examples that we could mention but we will mention the popular ones in the world of business. Usually independent variable is presented by the letter x and the dependent variable is presented by the letter y. A business man would like to see whether there is a relationship between the number of cases of sold and the temperature in a hot summer day based on information taken from the past. He also would like to estimate the number cases of soda which will be sold in a particular hot summer day in a ball game. He clearly recorded temperatures and number of cases of soda sold on those particular days. The following table shows the recorded data from June 1 through June 13. The weatherman predicts a 94F degree temperature for June 14. The businessman would like to meet all demands for the cases of sodas ordered by customers on June 14. Now lets use Excel to find the linear correlation coefficient and the regression line equation. The linear correlation coefficient is a quantity between -1 and 1. This quantity is denoted by R . The closer R to 1 the stronger positive (direct) correlation and similarly the closer R to -1 the stronger negative (inverse) correlation exists between the two variables. The general form of the regression line is y mx b. In this formula, m is the slope of the line and b is the y-intercept. You can find these quantities from the Excel output. In this situation the variable y (the dependent variable) is the number of cases of soda and the x (independent variable) is the temperature. To find the Excel output the following steps can be taken: Step 1. From the menus choose Tools and click on Data Analysis. Step 2. When Data Analysis dialog box appears, click on correlation. Step 3. When correlation dialog box appears, enter B1:C14 in the input range box. Click on Labels in first row and enter a16 in the output range box. Click on OK. As you see the correlation between the number of cases of soda demanded and the temperature is a very strong positive correlation. This means as the temperature increases the demand for cases of soda is also increasing. The linear correlation coefficient is 0.966598577 which is very close to 1. Now lets follow same steps but a bit different to find the regression equation. Step 1. From the menus choose Tools and click on Data Analysis Step 2 . When Data Analysis dialog box appears, click on regression . Step 3. When Regression dialog box appears, enter b1:b14 in the y-range box and c1:c14 in the x-range box. Click on labels . Step 4. Enter a19 in the output range box . Note: The regression equation in general should look like Ym X b. In this equation m is the slope of the regression line and b is its y-intercept. Adjusted R Square The relationship between the number of cans of soda and the temperature is: Y 0.879202711 X 9.17800767 The number of cans of soda 0.879202711(Temperature) 9.17800767. Referring to this expression we can approximately predict the number of cases of soda needed on June 14. The weather forecast for this is 94 degrees, hence the number of cans of soda needed is equal to The number of cases of soda0.879202711(94) 9.17800767 91.82 or about 92 cases. Moving Average and Exponential Smoothing Moving Average Models: Use the Add Trendline option to analyze a moving average forecasting model in Excel. You must first create a graph of the time series you want to analyze. Select the range that contains your data and make a scatter plot of the data. Once the chart is created, follow these steps: Click on the chart to select it, and click on any point on the line to select the data series. When you click on the chart to select it, a new option, Chart, s added to the menu bar. From the Chart menu, select Add Trendline. The following is the moving average of order 4 for weekly sales: Exponential Smoothing Models: The simplest way to analyze a timer series using an Exponential Smoothing model in Excel is to use the data analysis tool. This tool works almost exactly like the one for Moving Average, except that you will need to input the value of a instead of the number of periods, k. Once you have entered the data range and the damping factor, 1- a. and indicated what output you want and a location, the analysis is the same as the one for the Moving Average model. Applications and Numerical Examples Descriptive Statistics: Suppose you have the following, n 10, data: 1.2, 1.5, 2.6, 3.8, 2.4, 1.9, 3.5, 2.5, 2.4, 3.0 Type your n data points into the cells A1 through An. Click on the Tools menu. (At the bottom of the Tools menu will be a submenu Data Analysis. , if the Analysis Tool Pack has been properly installed.) Clicking on Data Analysis. will lead to a menu from which Descriptive Statistics is to be selected. Select Descriptive Statistics by pointing at it and clicking twice, or by highlighting it and clicking on the Okay button. Within the Descriptive Statistics submenu, a. for the input range enter A1:Dn, assuming you typed the data into cells A1 to An. b. click on the output range button and enter the output range C1:C16. do. click on the Summary Statistics box d. finally, click on Okay. The Central Tendency: The data can be sorted in ascending order: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 The mean, median and mode are computed as follows: (1.2 1.5 2.6 3.8 2.4 1.9 3.5 2.5 2.4 3.0) 10 2.48 The mode is 2.4, since it is the only value that occurs twice. The midrange is (1.2 3.8) 2 2.5. Note that the mean, median and mode of this set of data are very close to each other. This suggests that the data is very symmetrically distributed. Variance: The variance of a set of data is the average of the cumulative measure of the squares of the difference of all the data values from the mean. The sample variance-based estimation for the population variance are computed differently. The sample variance is simply the arithmetic mean of the squares of the difference between each data value in the sample and the mean of the sample. On the other hand, the formula for an estimate for the variance in the population is similar to the formula for the sample variance, except that the denominator in the fraction is (n-1) instead of n. However, you should not worry about this difference if the sample size is large, say over 30. Compute an estimate for the variance of the population . given the following sorted data: 1.2, 1.5, 1.9, 2.4, 2.4, 2.5, 2.6, 3.0, 3.5, 3.8 mean 2.48 as computed earlier. An estimate for the population variance is: s 2 1 (10-1) (1.2 - 2.48) 2 (1.5 - 2.48) 2 (1.9 - 2.48) 2 (2.4 -2.48) 2 (2.4 - 2.48) 2 (2.5 - 2.48) 2 (2.6 - 2.48) 2 (3.0 - 2.48) 2 (3.5 -2.48) 2 (3.8 - 2.48) 2 (1 9) (1.6384 0.9604 0.3364 0.0064 0.0064 0.0004 0.0144 0.2704 1.0404 1.7424) 0.6684 Therefore, the standard deviation is s ( 0.6684 ) 12 0.8176 Probability and Expected Values: Newsweek reported that average take for bank robberies was 3,244 but 85 percent of the robbers were caught. Assuming 60 percent of those caught lose their entire take and 40 percent lose half, graph the probability mass function using EXCEL. Calculate the expected take from a bank robbery. Does it pay to be a bank robber To construct the probability function for bank robberies, first define the random variable x, bank robbery take. If the robber is not caught, x 3,244. If the robber is caught and manages to keep half, x 1,622. If the robber is caught and loses it all, then x 0. The associated probabilities for these x values are 0.15 (1 - 0.85), 0.34 (0.85)(0.4), and 0.51 (0.85)(0.6). After entering the x values in cells A1, A2 and A3 and after entering the associated probabilities in B1, B2, and B3, the following steps lead to the probability mass function: Click on ChartWizard. The ChartWizard Step 1 of 4 screen will appear. Highlight Column at ChartWizard Step 1 of 4 and click Next. At ChartWizard Step 2 of 4 Chart Source Data, enter B1:B3 for Data range, and click column button for Series in. A graph will appear. Click on series toward the top of the screen to get a new page. At the bottom of the Series page, is a rectangle for Category (X) axis labels: Click on this rectangle and then highlight A1:A3. At Step 3 of 4 move on by clicking on Next, and at Step 4 of 4, click on Finish. The expected value of a robbery is 1,038.08. E(X) (0)(0.51)(1622)(0.34) (3244)(0.15) 0 551.48 486.60 1038.08 The expected return on a bank robbery is positive. On average, bank robbers get 1,038.08 per heist. If criminals make their decisions strictly on this expected value, then it pays to rob banks. A decision rule based only on an expected value, however, ignores the risks or variability in the returns. In addition, our expected value calculations do not include the cost of jail time, which could be viewed by criminals as substantial. Discrete Continuous Random Variables: Binomial Distribution Application: A multiple choice test has four unrelated questions. Each question has five possible choices but only one is correct. Thus, a person who guesses randomly has a probability of 0.2 of guessing correctly. Draw a tree diagram showing the different ways in which a test taker could get 0, 1, 2, 3 and 4 correct answers. Sketch the probability mass function for this test. What is the probability a person who guesses will get two or more correct Solution: Letting Y stand for a correct answer and N a wrong answer, where the probability of Y is 0.2 and the probability of N is 0.8 for each of the four questions, the probability tree diagram is shown in the textbook on page 182. This probability tree diagram shows the branches that must be followed to show the calculations captured in the binomial mass function for n 4 and 0.2. For example, the tree diagram shows the six different branch systems that yield two correct and two wrong answers (which corresponds to 4(22) 6. The binomial mass function shows the probability of two correct answers as P(x 2 n 4, p 0.2) 6(.2)2(.8)2 6(0.0256) 0.1536 P(2) Which is obtained from excel by using the BINOMDIST Command, where the first entry is x, the second is n, and the third is mass (0) or cumulative (1) that is, entering BINOMDIST(2,4,0.2,0) IN ANY EXCEL CELL YIELDS 0.1536 AND BINOMDIST(3,4,0.2,0) YIELDS P(x3n4, p 0.2) 0.0256 BINOMDIST(4,4,0.2,0) YIELDS P(x4n4, p 0.2) 0.0016 1-BINOMDIST(1,4,0.2,1) YIELDS P(x 179 2 n 4, p 0.2) 0.1808 Normal Example: If the time required to complete an examination by those with a certain learning disability is believed to be distributed normally, with mean of 65 minutes and a standard deviation of 15 minutes, then when can the exam be terminated so that 99 percent of those with the disability can finish Solution: Because t he average and standard deviation are known, what needs to be established is the amount of time, above the mean time, such that 99 percent of the distribution is lower. This is a distance that is measured in standard deviations as given by the Z value corresponding to the 0.99 probability found in the body of Appendix B, Table 5,as shown in the textbook OR the commands entered into any cell of Excel to find this Z value is NORMINV(0.99,0,1) for 2.326342. The closest cumulative probability that can be found is 0.9901, in the row labeled 2.3 and column headed by .03, Z 2.33, which is only an approximation for the more exact 2.326342 found in Excel. Using this more exact value the calculation with mean m and standard deviation s in the following formula would be Z ( X - m ) s That is, Z ( x - 65)15 Thus, x 65 15(2.32634) 99.9 minutes. Alternatively, instead of standardizing with the Z distribution using Excel we can simply work directly with the normal distribution with a mean of 65 and standard deviation of 15 and enter NORMINV(0.99,65,15). In general to obtain the x value for which alpha percent of a normal random variables values are lower, the following NORMINV command may be used, where the first entry is a. the second is m. and the third is s. Another Example: In the early 1980s, the Toro Company of Minneapolis, Minnesota, advertised that it would refund the purchase price of a snow blower if the following winters snowfall was less than 21 percent of the local average. If the average snowfall is 45.25 inches, with a standard deviation of 12.2 inches, what is the likelihood that Toro will have to make refunds Solution: Within limits, snowfall is a continuous random variable that can be expected to vary symmetrically around its mean, with values closer to the mean occurring most often. Thus, it seems reasonable to assume that snowfall (x) is approximately normally distributed with a mean of 45.25 inches and standard deviation of 12.2 inches. Nine and one half inches is 21 percent of the mean snowfall of 45.25 inches and, with a standard deviation of 12.2 inches, the number of standard deviations between 45.25 inches and 9.5 inches is Z: Z ( x - m ) s (9.50 - 45.25)12.2 -2.93 Using Appendix B, Table 5, the textbook demonstrates the determination of P(x 163 9.50) P(z 163 -2.93) 0.17, the probability of snowfall less than 9.5 inches. Using Excel, this normal probability is obtained with the NORMDIST command, where the first entry is x, the second is mean m. the third is standard deviation s, and the fourth is CUMULATIVE (1). Entering NORMDIST(9.5,45.25,12.2,1), Gives P( x 163 9.50) 0.001693. Sampling Distribution and the Central Limit Theorem : A bakery sells an average of 24 loaves of bread per day. Sales (x) are normally distributed with a standard deviation of 4. If a random sample of size n 1 (day) is selected, what is the probability this x value will exceed 28 If a random sample of size n 4 (days) is selected, what is theprobability that xbar 179 28 Why does the answer in part 1 differ from that in part 2 1. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 4. Thus, using Excel, 0.15866 1-NORMDIST(28,24,4,1). 2. The sampling distribution of the sample mean xbar is normal with a mean of 24 and a standard error of the mean of 2 using Excel, 0.02275 1-NORMDIST(28,24,2,1). Regression Analysis: The highway deaths per 100 million vehicle miles and highway speed limits for 10 countries, are given below: (Death, Speed) (3.0, 55), (3.3, 55), (3.4, 55), (3.5, 70), (4.1, 55), (4.3, 60), (4.7, 55), (4.9, 60), (5.1, 60), and (6.1, 75). From this we can see that five countries with the same speed limit have very different positions on the safety list. For example, Britain. with a speed limit of 70 is demonstrably safer than Japan, at 55. Can we argue that, speed has little to do with safety. Use regression analysis to answer this question. Solution: Enter the ten paired y and x data into cells A2 to A11 and B2 to B11, with the death rate label in A1 and speed limits label in B1, the following steps produce the regression output. Choose Regression from Data Analysis in the Tools menu. The Regression dialog box will will appear. Note: Use the mouse to move between the boxes and buttons. Click on the desired box or button. The large rectangular boxes require a range from the worksheet. A range may be typed in or selected by highlighting the cells with the mouse after clicking on the box. If the dialog box blocks the data, it can be moved on the screen by clicking on the title bar and dragging. For the Input Y Range, enter A1 to A11, and for the Input X Range enter B1 to B11. Because the Y and X ranges include the Death and Speed labels in A1 and B1, select the Labels box with a click. Click the Output Range button and type reference cell, which in this demonstration is A13. To get the predicted values of Y (Death rates) and residuals select the Residuals box with a click. Your screen display should show a Table, clicking OK will give the SUMMARY OUTPUT, ANOVA AND RESIDUAL OUTPUT The first section of the EXCEL printout gives SUMMARY OUTPUT. The Multiple R is the square root of the R Square the computation and interpretation of which we have already discussed. The Standard Error of estimate (which will be discussed in the next chapter) is s 0.86423, which is the square root of Residual SS 5.97511 divided by its degrees of freedom, df 8, as given in the ANOVA section. We will also discuss the adjusted R-square of 0.21325 in the following chapters. Under the ANOVA section are the estimated regression coefficients and related statistics that will be discussed in detail in the next chapter. For now it is sufficient to recognize that the calculated coefficient values for the slope and y intercept are provided (b 0.07556 and a -0.29333). Next to these coefficient estimates is information on the variability in the distribution of the least-squares estimators from which these specific estimates were drawn: the column titled Std. Error contains the standard deviations (standard errors) of the intercept and slope distributions the t-ratio and p columns give the calculated values of the t statistics and associated p-values. As shown in Chapter 13, the t statistic of 1.85458 and p-value of 0.10077, for example, indicates that the sample slope (0.07556) is sufficiently different from zero, at even the 0.10 two-tail Type I error level, to conclude that there is a significant relationship between deaths and speed limits in the population. This conclusion is contrary to assertion that speed has little to do with safety. SUMMARY OUTPUT: Multiple R 0.54833, R Square 0.30067, Adjusted R Square 0.21325, Standard Error 0.86423, Observations 10 ANOVA df SS MS F P-value Regression 1 2.56889 2.56889 3.43945 0.10077 Residual 8 5.97511 0.74689 Total 9 8.54400 Coeffs. Estimate Std. Error T Stat P-value Lower 95 Upper 95 Intercept -0.29333 2.45963 -0.11926 0.90801 -5.96526 5.37860 Speed 0.07556 0.04074 1.85458 0.10077 -0.01839 0.16950 Predicted Residuals 3.86222 -0.86222 3.86222 -0.56222 3.86222 -0.46222 4.99556 -1.49556 3.86222 0.23778 4.24000 0.06000 3.86222 0.83778 4.24000 0.66000 4.24000 0.86000 5.37333 0.72667 Microsoft Excel Add-Ins Forecasting with regression requires the Excel add-in called Analysis ToolPak , and linear programming requires the Excel add-in called Solver . How you check to see if these are activated on your computer, and how to activate them if they are not active, varies with Excel version. Here are instructions for the most common versions. If Excel will not let you activate Data Analysis and Solver, you must use a different computer. Excel 20022003: Start Excel, then click Tools and look for Data Analysis and for Solver. If both are there, press Esc (escape) and continue with the respective assignment. Otherwise click Tools, Add-Ins, and check the boxes for Analysis ToolPak and for Solver, then click OK. Click Tools again, and both tools should be there. Excel 2007: Start Excel 2007 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the 8220Office Button8221 at top left - click the Excel Options button near the bottom of the resulting window - click the Add-ins button on the left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Excel 2017: Start Excel 2017 and click the Data tab at the top. Look to see if Data Analysis and Solver show in the Analysis section at the far right. If both are there, continue with the respective assignment. Otherwise, do the following steps exactly as indicated: - click the File tab at top left - click the Options button near the bottom of the left side - click the Add-ins button near the bottom left of the next screen - near the bottom at Manage Excel Add-ins, click Go - check the boxes for Analysis ToolPak and Solver Add-in if they are not already checked, then click OK - click the Data tab as above and verify that the add-ins show. Solving Linear Programs by Excel Some of these examples can be modified for other types problems Computer-assisted Learning: E-Labs and Computational Tools My teaching style deprecates the plug the numbers into the software and let the magic box work it out approach. Personal computers, spreadsheets, e. g. Excel. professional statistical packages (e. g. such as SPSS), and other information technologies are now ubiquitous in statistical data analysis. Without using these tools, one cannot perform any realistic statistical data analysis on large data sets. The appearance of other computer software, JavaScript Applets. Statistical Demonstrations Applets. and Online Computation are the most important events in the process of teaching and learning concepts in model-based statistical decision making courses. These tools allow you to construct numerical examples to understand the concepts, and to find their significance for yourself. Use any or online interactive tools available on the WWW to perform statistical experiments (with the same purpose, as you used to do experiments in physics labs to learn physics) to understand statistical concepts such as Central Limit Theorem are entertaining and educating. Computer-assisted learning is similar to the experiential model of learning. The adherents of experiential learning are fairly adamant about how we learn. Learning seldom takes place by rote. Learning occurs because we immerse ourselves in a situation in which we are forced to perform and think. You get feedback from the computer output and then adjust your thinking-process if needed. A SPSS-Example . SPSS-Examples . SPSS-More Examples . (Statistical Package for the Social Sciences) is a data management and analysis product. It can perform a variety of data analysis and presentation functions, including statistical analyses and graphical presentation of data. SAS (Statistical Analysis System) is a system of software packages some of its basic functions and uses are: database management inputting, cleaning and manipulating data, statistical analysis, calculating simple statistics such as means, variances, correlations running standard routines such as regressions. Available at: SPSSSAS Packages on Citrix (Installing and Accessing ) Use your email ID and Password: Technical Difficulties OTS Call Center (401) 837-6262 Excel Examples. Excel More Examples It is Excellent for Descriptive Statistics, and getting acceptance is improving, as computational tool for Inferential Statistics. The Value of Performing Experiment: If the learning environment is focused on background information, knowledge of terms and new concepts, the learner is likely to learn that basic information successfully. However, this basic knowledge may not be sufficient to enable the learner to carry out successfully the on-the-job tasks that require more than basic knowledge. Thus, the probability of making real errors in the business environment is high. On the other hand, if the learning environment allows the learner to experience and learn from failures within a variety of situations similar to what they would experience in the real world of their job, the probability of having similar failures in their business environment is low. This is the realm of simulations-a safe place to fail. The appearance of statistical software is one of the most important events in the process of decision making under uncertainty. Statistical software systems are used to construct examples, to understand the existing concepts, and to find new statistical properties. On the other hand, new developments in the process of decision making under uncertainty often motivate developments of new approaches and revision of the existing software systems. Statistical software systems rely on a cooperation of statisticians, and software developers. Beside the professional statistical software Online statistical computation . and the use of a scientific calculator is required for the course. A Scientific Calculator is the one, which has capability to give you, say, the result of square root of 5. Any calculator that goes beyond the 4 operations is fine for this course. These calculators allow you to perform simple calculations you need in this course, for example, enabling you to take square root, to raise e to the power of say, 0.36. i tak dalej. These types of calculators are called general Scientific Calculators. There are also more specific and advanced calculators for mathematical computations in other areas such as Finance, Accounting, and even Statistics. The last one, for example, computes mean, variance, skewness, and kurtosis of a sample by simply entering all data one-by-one and then pressing any of the mean, variance, skewness, and kurtosis keys. Without a computer one cannot perform any realistic statistical data analysis. Students who are signing up for the course are expected to know the basics of Excel. As a starting point, you need visiting the Excel Web site created for this course. If you are challenged by or unfamiliar with Excel, you may seek tutorial help from the Academic Resource Center at 410-837-5385, E-mail. What and How to Hand-in My Computer Assignment For the computer assignment I do recommend in checking your hand computation homework, and checking some of the numerical examples from your textbook. As part of your homework assignment you don not have to hand in the printout of the computer assisted learning, however, you must include within your handing homework a paragraph entitled Computer Implementation describing your (positive or negative) experience. Interesting and Useful Sites The Copyright Statement: The fair use, according to the 1996 Fair Use Guidelines for Educational Multimedia. of materials presented on this Web site is permitted for non-commercial and classroom purposes only. This site may be mirrored intact (including these notices), on any server with public access. All files are available at home. ubalt. eduntsbarshBusiness-stat for mirroring. Kindly e-mail me your comments, suggestions, and concerns. Dziękuję Ci. EOF: CopyRights 1994-2018.

No comments:

Post a Comment