historyk programowania

istnieje również wiele niewłaściwych sposobów uwzględniania zmiennych. Model grawitacji nie będzie działał, chyba że każda zmienna spełnia następujące kryteria:

  • numeryczny
  • kompletny
  • niezawodny

tylko dane numeryczne

ponieważ model grawitacji jest równaniem matematycznym, wszystkie zmienne wejściowe muszą być numeryczne. Może to być Liczba (populacja), miara przestrzenna (powierzchnia, odległość itp.), Czas (godziny z Londynu na piechotę), procent (wzrost/spadek płac), wartość waluty (płace w szylingach) lub inna miara miejsc zaangażowanych w model.

liczby muszą być znaczące i nie mogą być nominalnymi zmiennymi kategorycznymi, które działają jako stand-in dla atrybutu jakościowego. Na przykład nie można dowolnie przypisać numeru i użyć go w modelu, jeśli numer nie ma znaczenia (np. road quality = dobry, lub road quality = 4). Chociaż ten ostatni jest liczbowy, nie jest miarą jakości dróg. Zamiast tego możesz użyć średniej prędkości podróży w milach na godzinę jako wskaźnika jakości drogi. To, czy średnia prędkość jest miarą jakości drogi, zależy od ciebie, aby określić i bronić jako autora badania.

Ogólnie rzecz biorąc, jeśli możesz to zmierzyć lub policzyć, możesz to modelować.

tylko Pełne Dane

Wszystkie kategorie danych muszą istnieć dla każdego punktu zainteresowania. Oznacza to, że wszystkie z 32 analizowanych hrabstw muszą mieć wiarygodne dane dla każdego współczynnika push and pull. Nie możesz mieć żadnych luk lub luk, takich jak jeden powiat, w którym nie masz średniej płacy.

tylko wiarygodne dane

powiedzenie informatyczne „śmieć w, śmieć Na Zewnątrz” odnosi się również do modeli grawitacyjnych, które są tak wiarygodne, jak dane użyte do ich budowy. Oprócz wyboru solidnych i wiarygodnych danych historycznych ze źródeł, którym możesz zaufać, istnieje wiele sposobów na popełnianie błędów, które sprawią, że wyniki twojego modelu będą pozbawione sensu. Na przykład warto upewnić się, że dane, które posiadasz, dokładnie pasują do terytoriów (np. dane hrabstwa reprezentują hrabstwa, a nie dane miasta reprezentują Hrabstwo).

w zależności od czasu i miejsca nauki, może być trudno uzyskać wiarygodny zestaw danych, na których można oprzeć swój model. Im dalej w przeszłości jeden badania, tym trudniejsze może być. Podobnie, może być łatwiej przeprowadzić tego typu analizy w społeczeństwach, które były mocno zbiurokratyzowane i pozostawiły po sobie dobry papierowy ślad, na przykład w Europie czy Ameryce Północnej.

aby zapewnić jakość danych w tym studium przypadku, każda zmienna została wiarygodnie obliczona lub zaczerpnięta z opublikowanych zweryfikowanych danych historycznych (patrz Tabela 1). Dokładnie, jak te dane zostały zebrane, można przeczytać w oryginalnym artykule, w którym zostało to dogłębnie wyjaśnione.11

nasze pięć zmiennych modelu

mając na uwadze powyższe zasady, mogliśmy wybrać dowolną liczbę zmiennych, biorąc pod uwagę to, co wiedzieliśmy o współczynnikach push i pull migracji. Zdecydowaliśmy się na pięć (5), wybranych na podstawie tego, co uważaliśmy za najważniejsze i co wiedzieliśmy, że może być poparte wiarygodnymi danymi.

zmienna źródło
population at origin 1771 values, Wrigley, „English county populations”, PP. 54-5.12
odległość od Londynu obliczona za pomocą oprogramowania
cena pszenicy „13
przeciętne płace w kraju pochodzenia , „industrializacja i nierówności Regionalne”, s. 11-12. 965-6.14
trajektoria płac Hunt, „industrializacja i nierówności Regionalne”, s. 10. 965-6.15

Tabela 1: Pięć zmiennych użytych w modelu i źródło każdej z nich w recenzowanej literaturze

po podjęciu decyzji w sprawie tych zmiennych, współautor oryginalnego badania, Adam Dennett, postanowił przepisać formułę, aby była ona samodzielna, tak aby łatwo było stwierdzić, które bity dotyczyły każdej z tych pięciu zmiennych. To dlatego powyższy wzór wygląda inaczej niż w oryginalnej pracy badawczej. Nowe symbole można zobaczyć w tabeli 2:

dwie dodatkowe zmienne $i$ I $j$ oznaczają odpowiednio „w punkcie pochodzenia” i „w Londynie”. $Wa_{i}$ oznacza „poziom płac w miejscu pochodzenia”, podczas gdy $Wa_{j}$ oznacza „poziom płac w Londynie”. Te siedem nowych symboli może zastąpić bardziej ogólne we wzorze:

\

jest to teraz bardziej gadatliwa i nieco samo-udokumentowana wersja poprzedniego równania. Obie rozwiązują matematycznie dokładnie w ten sam sposób, ponieważ zmiany są czysto powierzchowne i z korzyścią dla ludzkiego użytkownika.

kompletny zestaw danych zmiennych

aby ułatwić samouczek, dane dla każdej z 5 zmiennych i każdego z 32 hrabstw zostały już skompilowane i wyczyszczone i można je zobaczyć w tabeli 3 lub pobrać jako plik csv. Tabela ta zawiera również znaną liczbę Włóczęgów z tego powiatu, obserwowaną w podstawowym zapisie źródłowym:

Tabela 3: pięć zmiennych użytych w modelu dla każdego z 32 powiatów. Są to dane, które trafiają do modelu, aby obliczyć wynik.
Hrabstwo włóczęgi $d$ km do Londynu $P$ populacja (osoby) $Wa$ średnia płaca (szylingi) $WaT$ płaca trajektoria 1767-95 (%zmiana) $Wh$ cena pszenicy (szylingi)
Bedfordshire 26 61.9 54836 87 1.149 61.79
Berkshire 111 61.7 101939 90 4.44 63.07
Buckinghamshire 79 46.7 95936 96 -8.33 63.09
Cambridgeshire 32 86.8 80497 88 11.36 60.05
Cheshire 34 255.1 158038 80 35.00 69.19
Kornwalia 40 364.6 142179 81 14.81 67.94
Cumberland 13 407.3 96862 78 38.46 64.42
Derbyshire 28 196.9 122593 75 48.00 68.02
Devon 98 272.5 279652 89 -7.87 69.98
Dorset 27 176.8 97262 81 22.22 67.30
Durham 25 380.7 119779 78 33.33 63.16
Gloucestershire 162 157.1 215576 81 9.88 66.54
Hampshire 78 102.4 166648 96 6.25 61.45
Herefordshire 45 190.5 81882 70 28.57 62.05
Hertfordshire 99 35.3 95868 90 4.44 63.82
Huntingdonshire 21 87.5 35370 89 7.87 58.72
Lancashire 94 281.8 301407 78 55.13 71.65
Leicestershire 20 146.1 107028 79 65.82 64.84
Lincolnshire 41 179.8 181814 84 26.19 58.73
Northamptonshire 33 107.6 128798 78 21.79 63.81
Northumberland 58 440.0 148148 72 70.83 58.22
Nottinghamshire 31 187.5 98216 108 0.00 61.30
Oxfordshire 78 86.8 99354 84 25.00 64.23
Rutland 2 132.5 15123 90 10.00 64.12
Shropshire 75 214.0 147303 76 18.42 66.50
Somerset 159 180.4 234179 77 3.90 68.29
Staffordshire 82 185.3 175075 76 18.42 67.80
Warwickshire 104 149.3 152050 96 -3.13 65.05
Westmorland 5 365.0 38342 74 62.16 71.05
Wiltshire 99 131.7 182421 84 20.24 63.64
Worcestershire 94 164.4 130757 81 25.93 65.78
Yorkshire 127 282.2 651709 80 58.33 61.87

ostateczna różnica między tą formułą a tą używaną w oryginalnym artykule polega na tym, że dwie zmienne mają silniejszy związek z włóczęgostwem, gdy są wykreślone naturalnie logarytmicznie. Są to populacja w miejscu pochodzenia ($P$) i odległość od miejsca pochodzenia do Londynu ($d$). Oznacza to, że dla danych w tym badaniu linia regresji (czasami nazywana linią najlepszego dopasowania) jest lepszym dopasowaniem, gdy dane zostały zarejestrowane niż wtedy, gdy nie było. Można to zobaczyć na rysunku 7, z niezalogowanymi liczbami populacji po lewej stronie, a zalogowaną wersją po prawej. Więcej punktów znajduje się bliżej linii najlepszego dopasowania na wykresie zalogowanym niż na wykresie niezalogowanym.

Rysunek 7: Liczba Włóczęgów wykreślona z populacją w miejscu pochodzenia (po lewej) i logiem naturalnym populacji pochodzenia (po prawej) z prostą linią regresji nałożoną na oba. Zwróć uwagę na silniejszą zależność między dwiema zmiennymi widocznymi na drugim wykresie.

ponieważ tak jest w przypadku tych konkretnych danych (twoje własne dane w podobnym badaniu mogą nie podążać za tym wzorem), wzór został dostosowany do korzystania z naturalnie rejestrowanych wersji tych dwóch zmiennych, w wyniku czego końcowy wzór użyty w modelu grawitacji (Rysunek 8). Nie mogliśmy wiedzieć o potrzebie tej korekty, dopóki nie zebraliśmy naszych zmiennych danych:

Rysunek 8: końcowy wzór modelu grawitacyjnego w podziale na stopnie i oznaczony kolorami. Elementy w czerni to operacje matematyczne. Elementy w Kolorze Niebieskim reprezentują nasze zmienne, które właśnie zebraliśmy (Krok 1). Elementy w kolorze czerwonym reprezentują wagi każdej zmiennej, którą musimy obliczyć (Krok 2), A Element w kolorze pomarańczowym jest ostatecznym oszacowaniem Włóczęgów z tego hrabstwa, które możemy obliczyć, gdy mamy inne informacje (Krok 3).

wartości w tabeli 3 dają nam wszystko, czego potrzebujemy, aby wypełnić niebieskie części każdego równania na rysunku 8. Możemy teraz zwrócić naszą uwagę na czerwone części, które mówią nam, jak ważna jest każda zmienna w modelu ogólnym, i dają nam liczby potrzebne do wypełnienia równania.

Krok 2: Określanie wag

wagi dla każdej zmiennej mówią nam, jak ważny jest ten współczynnik push/pull w stosunku do innych zmiennych podczas próby oszacowania liczby Włóczęgów, które powinny pochodzić z danego hrabstwa. Parametry $β$ muszą być określone w całym zbiorze danych ze znanych danych. Dzięki nim będziemy mogli porównać Indywidualne obserwacje specyficzne dla Pochodzenia z modelem ogólnym. Następnie możemy zbadać te i zidentyfikować ponad i pod przewidywanymi przepływami między różnymi początkami i miejscem przeznaczenia.

na tym etapie nie wiemy, jak ważna jest każda z nich. Może cena pszenicy jest lepszym wskaźnikiem migracji niż odległość? Nie dowiemy się, dopóki nie obliczymy wartości od $β1$ do $β5$ (wag), rozwiązując powyższe równanie. Punkt przecięcia osi y ($β0$) można obliczyć tylko wtedy, gdy poznamy wszystkie pozostałe ($β1-β5$). Są to czerwone wartości na rysunku 8 powyżej. Wagi można zobaczyć w tabeli 4 i w tabeli A1 oryginalnego papieru.16 teraz zademonstrujemy, w jaki sposób doszliśmy do tych wartości.

aby obliczyć te wartości long-hand wymaga niesamowitej pracy. Użyjemy szybkiego rozwiązania w języku programowania R, które wykorzystuje pakiet masy Williama Venablesa i Briana Ripleya, który może rozwiązać ujemne równania regresji dwumianowej, takie jak nasz model grawitacji za pomocą pojedynczej linii kodu. Jednak ważne jest, aby zrozumieć zasady, które stoją za tym, co się robi, aby docenić to, co robi kod (zwróć uwagę, że poniższe sekcje nie wykonują obliczeń, ale wyjaśniają jej kroki; zrobimy obliczenia z kodem dalej na stronie).

Obliczanie indywidualnych Wag (w zasadzie)

$β_{1}$, $ β_{2}$, itp., są takie same jak $β$ w powyższym prostym modelu regresji liniowej, który jest nachyleniem linii regresji (wzrost w ciągu lub o ile $y$ wzrasta, gdy $x$ wzrasta o 1). Jedyną różnicą między prostą regresją liniową a naszym modelem grawitacji jest to, że musimy obliczyć 5 zboczy zamiast 1.

prosta regresja liniowa\(y = α + ßx\)

musimy rozwiązać dla każdego z tych pięciu zboczy, zanim będziemy mogli obliczyć punkt przecięcia osi Y w następnym kroku. Dzieje się tak dlatego, że zbocza różnych wartości $β$ są częścią równania do obliczania przecięcia osi Y.

wzór na obliczenie $ β$ w analizie regresji to:

\

współczynnik korelacji Pearsona

współczynnik korelacji Pearsona można obliczyć długością, ale w tym przypadku jest to dość długie obliczenie, wymagające 64 liczb. Istnieje kilka świetnych samouczków wideo w języku angielskim dostępnych online, Jeśli chcesz zobaczyć, jak wykonać obliczenia na dłuższą rękę.17 Istnieje również wiele kalkulatorów online, które obliczą $r$ dla Ciebie, jeśli podasz dane. Biorąc pod uwagę dużą liczbę cyfr do obliczenia, polecam stronę internetową z wbudowanym narzędziem zaprojektowanym do tego obliczenia. Upewnij się, że wybierzesz renomowaną stronę, taką jak ta oferowana przez Uniwersytet.

Obliczanie $s_{y}$ & $s_{x}$ (odchylenie standardowe)

odchylenie standardowe jest sposobem wyrażenia, ile odchylenia od średniej (średniej) jest w danych. Innymi słowy, czy dane są dość skupione wokół średniej, czy też rozprzestrzenianie się jest znacznie szersze?

Ponownie, istnieją kalkulatory online i pakiety oprogramowania statystycznego, które mogą wykonać te obliczenia za Ciebie, jeśli podasz dane.

Obliczanie $β_{0}$ (punkt przecięcia osi y)

następnie musimy obliczyć punkt przecięcia osi Y. Wzór na obliczenie punktu przecięcia osi y w prostej regresji liniowej jest następujący:

\

jednak obliczenia stają się znacznie bardziej skomplikowane w analizie regresji wielokrotnej, ponieważ każda zmienna wpływa na obliczenia. To sprawia, że robienie tego ręcznie jest bardzo trudne i jest jednym z powodów, dla których wybieramy rozwiązanie programowe.

kod do obliczania wag

pakiet statystyczny masy, napisany dla języka programowania R, ma funkcję, która może rozwiązywać ujemne równania regresji dwumianowej, dzięki czemu bardzo łatwo jest obliczyć, co w przeciwnym razie byłoby bardzo trudnym wzorem długiej ręki.

Ta sekcja zakłada, że zainstalowałeś R i zainstalowałeś pakiet MASS. Jeśli tego nie zrobiłeś, będziesz musiał to zrobić przed kontynuowaniem. Taryn Dewar ’ s tutorial on R Basics with Tabular Data includes R installation instructions.

aby użyć tego kodu, musisz pobrać kopię zbioru danych pięciu zmiennych plus liczbę obserwowanych Włóczęgów z każdego z 32 hrabstw. Jest to dostępne powyżej jako Tabela 3, lub można pobrać jako .plik csv. Niezależnie od wybranego trybu, zapisz plik jako VagrantsExampleData.csv. Jeśli używasz komputera Mac, zapisz go jako format Windows .plik csv. Otwórz VagrantsExampleData.csv i zapoznać się z jego zawartością. Powinieneś zauważyć każdy z 32 powiatów, wraz z każdą ze zmiennych, które omówiliśmy w tym samouczku. Będziemy używać nagłówków kolumn, aby uzyskać dostęp do tych danych za pomocą naszego programu komputerowego. Mogłem nazwać je cokolwiek, ale w tym pliku są:

  1. vagrants
  2. population
  3. distance
  4. wheat
  5. wages
  6. wageTrajectory

w tym samym katalogu, w którym zapisałeś plik csv, Utwórz i zapisz nowy plik skryptu R (możesz to zrobić za pomocą dowolnego edytora tekstu lub RStudio, ale nie używaj edytora tekstu, takiego jak MS Word). Zapisz to jako wag kalkulacje.r.

napiszemy teraz krótki program, który:

  1. instaluje pakiet MASS
  2. wywołuje pakiet MASS, dzięki czemu możemy go użyć w naszym kodzie
  3. przechowuje zawartość .plik csv do zmiennej, której możemy użyć programowo
  4. rozwiązuje równanie modelu grawitacji za pomocą zestawu danych
  5. wyprowadza wyniki obliczeń.

każde z tych zadań zostanie zrealizowane z kolei za pomocą jednej linii kodu

skopiuj powyższy kod do swoich obliczeń wagowych.r plik i zapisz. Możesz teraz uruchomić kod używając swojego ulubionego środowiska R (ja używam RStudio) i wyniki obliczeń powinny pojawić się w oknie konsoli (jak to wygląda będzie zależeć od Twojego środowiska). Może być konieczne ustawienie katalogu roboczego środowiska R na katalog zawierający Twoje .csv i .pliki R. Jeśli używasz RStudio możesz to zrobić za pomocą menu (sesja – > Ustaw katalog roboczy – > Wybierz katalog). Możesz również osiągnąć to samo za pomocą polecenia:

setwd(PATH) #change "PATH" to the full location on your computer where the files can be found

zauważ, że linia 4 jest linią, która rozwiązuje równanie dla nas, używając glm.funkcja nb, która jest skrótem od „uogólnionego modelu liniowego-ujemnego dwumianu”. Ta linia wymaga wielu wejść:

  • nasze zmienne za pomocą nagłówków kolumn, jak zapisano w.plik csv, wraz z wszelkimi logami, które należy do nich wykonać (vagrants, log (population), log(distance), wheat, wages, wageTrajectory). Jeśli używasz modelu z własnymi danymi, dostosujesz je tak, aby odzwierciedlały nagłówki kolumn w zbiorze danych.
  • gdzie kod może znaleźć dane – w tym przypadku zmienna, którą zdefiniowaliśmy w linii 3 o nazwie gravityModelData.

wyniki obliczeń można zobaczyć na rysunku 9:

Rysunek 9: podsumowanie powyższego kodu, pokazujące wagi dla każdej zmiennej i punkt przecięcia osi y, wymienione w nagłówku ’ Estimate '($\beta_{0}$ do $\beta_{5}$. W podsumowaniu przedstawiono również szereg innych obliczeń, w tym istotność statystyczną.

Krok 3: Obliczając szacunki dla każdego Hrabstwa

musimy to zrobić raz dla każdego z 32 hrabstw.

można to zrobić za pomocą kalkulatora naukowego, tworząc formułę arkusza kalkulacyjnego lub pisząc program komputerowy. Aby to zrobić automatycznie w R, możesz dodać następujące elementy do kodu i ponownie uruchomić program. Ta pętla for oblicza oczekiwaną liczbę Włóczęgów z każdego z 32 powiatów w przykładzie i drukuje wyniki, które możesz zobaczyć:

aby zbudować zrozumienie, proponuję wykonać jedną długą rękę hrabstwa. W tym samouczku użyjemy Hertfordshire jako przykładu z długimi rękami (ale proces jest dokładnie taki sam dla pozostałych 31 hrabstw).

korzystając z danych dla Hertfordshire w tabeli 3 i wag dla każdej zmiennej w tabeli 4, możemy teraz wypełnić nasz wzór, który da wynik 95:

najpierw wymieńmy symbole na liczby, zaczerpnięte z tabel wymienionych powyżej.

następnie zacznij obliczać wartości, aby dostać się do oszacowania. Zapamiętanie matematycznego porządku operacji, pomnóż wartości przed dodaniem. Zacznij więc od obliczenia każdej zmiennej (możesz do tego użyć kalkulatora naukowego):

następnym krokiem jest dodanie liczb razem:

estimated vagrants = exp(4.56232408897)

i wreszcie, aby obliczyć funkcję wykładniczą (użyj kalkulatora naukowego):

estimated vagrants = 95.8059926832

wycofaliśmy resztę i zadeklarowaliśmy, że szacowana liczba Włóczęgów z Hertfordshire w tym modelu wynosi 95. Musisz przeprowadzić te same obliczenia dla każdego z pozostałych powiatów, które można przyspieszyć za pomocą programu arkusza kalkulacyjnego. Aby upewnić się, że możesz to zrobić ponownie, dodałem również liczby dla Buckinghamshire:

Hertfordshire

\

Buckinghamshire

\

polecam wybranie jednego innego hrabstwa i obliczenie go na długo przed przejściem dalej, aby upewnić się, że możesz wykonać obliczenia samodzielnie. Prawidłowa odpowiedź jest dostępna w tabeli 5, która porównuje zaobserwowane wartości (widoczne w podstawowym rekordzie źródłowym) z wartościami szacunkowymi (obliczonymi przez nasz model grawitacji). „Pozostałość” to różnica między tymi dwoma, z dużą różnicą sugerującą nieoczekiwaną liczbę Włóczęgów, które mogą być warte bliższego przyjrzenia się z czapką historyka.

Tabela 5: „obserwowana” i „szacowana” liczba biednych Włóczęgów z każdego powiatu, a także pozostała (różnica między nimi) dostępna jako Tabela 3 w oryginalnym artykule.
Powiat Wartość Obserwowana Wartość Szacunkowa Wartość Rezydualna
Bedfordshire 26 41 -15
Berkshire 111 76 35
Buckinghamshire 79 83 -4
Cambridgeshire 32 48 -16
Cheshire 34 44 -10
Kornwalia 40 42 -2
Cumberland 13 21 -8
Derbyshire 28 36 -8
Devon 98 121 -23
Dorset 27 36 -9
Durham 25 31 -6
Gloucestershire 162 123 39
Hampshire 78 92 -14
45 39 6
Hertfordshire 99 95 4
Huntingdonshire 21 18 3
Lancashire 94 84 10
Leicestershire 20 28 -8
Lincolnshire 41 86 -45
Northamptonshire 33 78 -45
58 29 29
Nottinghamshire 31 28 3
Oxfordshire 78 52 26
Rutland 2 4 -2
Shropshire 75 66 9
Somerset 159 145 14
Staffordshire 82 85 -3
104 70 34
Westmorland 5 5 0
Wiltshire 99 95 4
Worcestershire 94 53 41
Yorkshire 127 207 -80

Krok 4-interpretacja historyczna

na tym etapie proces modelowania jest zakończony, a ostatnim etapem jest interpretacja historyczna.

oryginalny artykuł, na którym oparto to studium przypadku, poświęcony jest przede wszystkim interpretacji tego, co wyniki modelowania oznaczają dla naszego zrozumienia migracji klas niższych w XVIII wieku. Jak widać na mapie na rysunku 5, były części kraju, które model zdecydowanie sugerował, wysyłały do Londynu imigrantów niższej klasy lub wysyłały ich za mało.

współautorzy przedstawili swoje interpretacje, dlaczego te wzory mogły się pojawić. Interpretacje te różniły się w zależności od miejsca. W rejonach północnej Anglii, które szybko się uprzemysłowiły, takich jak Yorkshire czy Manchester, lokalne możliwości wydawały się dawać ludziom mniej powodów do wyjazdu, co skutkowało niższą niż oczekiwano migracją do Londynu. Na słabnących obszarach na zachodzie, takich jak Bristol, urok Londynu był silniejszy, ponieważ więcej osób wyjechało szukając pracy w stolicy.

nie wszystkie wzory oczekiwano. Northumberland na dalekim północnym wschodzie okazał się regionalną anomalią, wysyłając do Londynu znacznie więcej (kobiet) migrantów, niż byśmy się spodziewali. Bez wyników modelu, jest mało prawdopodobne, że pomyślelibyśmy o rozważeniu Northumberland w ogóle, szczególnie dlatego, że był tak daleko od metropolii i przypuszczaliśmy, że będzie miał słabe powiązania z Londynem. Model ten dostarczył nam nowych dowodów do rozważenia jako historycy i zmienił nasze rozumienie relacji Londyn-Northumberland. Pełne omówienie naszych ustaleń można przeczytać w oryginalnym artykule.18

biorąc swoją wiedzę do przodu

po wypróbowaniu tego przykładowego problemu, powinieneś mieć jasne zrozumienie, jak korzystać z tej przykładowej formuły, a także tego, czy model grawitacji może być odpowiednim rozwiązaniem dla Twojego problemu badawczego. Masz doświadczenie i słownictwo, aby podejść i omówić modele grawitacji z odpowiednio doświadczonym matematycznie współpracownikiem, który pomoże Ci dostosować je do własnego studium przypadku.

jeśli masz szczęście, że masz również dane o migrantach przeprowadzających się do późnego XVIII-wiecznego Londynu i chcesz je modelować za pomocą tych samych pięciu zmiennych wymienionych powyżej, ta formuła działa tak, jak jest – jest tu łatwe badanie dla kogoś z odpowiednimi danymi. Model ten sprawdza się jednak nie tylko w badaniach nad migrantami przeprowadzającymi się do Londynu. Zmienne mogą się zmieniać, a celem podróży nie musi być Londyn. Byłoby możliwe użycie modelu grawitacji do badania migracji do starożytnego Rzymu lub Bangkoku XXI wieku, jeśli masz Dane i Pytanie badawcze. Nie musi to być nawet model migracji. Aby skorzystać z studium przypadku kolumbijskiej kawy ze wstępu, które koncentruje się na handlu, a nie migracji, Tabela 6 pokazuje realne zastosowanie tej samej formuły, niezmienionej.

Tabela 6: przykład, w jaki sposób powyższy wzór można zastosować do badania kolumbijskich wzorów eksportu kawy w 1950 r.
kryteria przykład eksportu kawy
jeden punkt pochodzenia eksport kawy z portu w Barranquilla w Kolumbii
wiele skończonych miejsc docelowych 21 krajów półkuli zachodniej w 1950
pięć zmiennych wyjaśniających (1) Liczba portów Oceanu Atlantyckiego w kraju przyjmującym (2) mile od Kolumbii, (3) Produkt krajowy brutto kraju przyjmującego, (4) Krajowa Kawa uprawiana w tonach, (5) kawiarnie na 10 000 osób

jest długa historia modeli grawitacji w nauce. Aby skutecznie wykorzystać je do badań, musisz zrozumieć podstawową teorię i matematykę za nimi oraz powody, dla których tak się rozwinęły. Ważne jest również, aby zrozumieć ich granice i warunki prawidłowego korzystania z nich, z których niektóre zostały omówione powyżej. Może również pomóc wiedzieć:

  • model grawitacji, taki jak ten użyty w tym przykładzie, może działać tylko w układzie zamkniętym. Powyższy model miał tylko 32 możliwe punkty pochodzenia, dzięki czemu można go było uruchomić 32 razy. Nieznana lub nieskończenie duża liczba punktów początkowych (lub miejsc docelowych w zależności od modelu) wymagałaby innego równania.

  • koncepcja modelu grawitacji opiera się również na założeniu, że ruchy (migracja, handel itp.) opierają się na zbiorze dobrowolnych indywidualnych decyzji, na które mogą mieć wpływ czynniki zewnętrzne, ale nie są przez nie całkowicie kontrolowane. Na przykład, dobrowolne migracje lub zakupy dokonane z wolnej woli mogą być modelowane za pomocą tej techniki, ale przymusowa migracja, przymusowy zakup lub naturalne procesy, takie jak Migracja ptaków lub przepływ rzeki, mogą nie być zgodne z tymi samymi zasadami i dlatego może być potrzebny inny model.

  • modele grawitacyjne mogą być wykorzystywane do przewidywania zachowań populacji, ale nie osób, a zatem próby modelowania danych powinny obejmować dużą liczbę ruchów w celu zapewnienia istotności statystycznej.

jest wiele innych pułapek, ale także ogromne możliwości. Mam nadzieję, że ten przegląd modelu grawitacji i towarzyszące mu opublikowane badania uczynią to potężne narzędzie bardziej dostępnym dla historyków. Jeśli planujesz użyć modelu grawitacji w swoich badaniach naukowych, autor zdecydowanie zaleca następujące artykuły:

podziękowania

z podziękowaniami dla Angeli Kedgley, Sarah Lloyd, Tima Hitchcocka, Joe Cozensa, Katriny Navickas i Leanne Calvert za przeczytanie i skomentowanie wcześniejszych wersji tego artykułu. Również podziękowania dla British Academy za sfinansowanie warsztatów pisarskich w Bogocie, w Kolumbii, na których powstał ten artykuł. A na koniec Adam Dennett za zapoznanie mnie z tymi wspaniałymi formułami i uwolnienie ich potencjału dla historyków.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.