[Esteartigofoipublicadopelaprimeiravezem[Thisarticlewasfirstpublishedon
R Analystatistics Sweden
, e gentilmente contribuiu para os R-blogueiros]. (Você pode relatar um problema sobre o conteúdo desta página aqui)
Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.
Para concluir a análise sobre a significância do setor no salário para diferentes grupos ocupacionais na Suécia, examinarei neste post a correlação entre salário e setor usando estatísticas para educação.
O valor F da tabela Anova é usado como o valor único para discriminar o quanto a região e o salário se correlacionam. Para análise exploratória, o valor Anova parece bom o suficiente.
Primeiro, defina bibliotecas e funções.
library (tidyverse)
## -- Attaching packages --------------------------------------------------- tidyverse 1.3.0 --
## v ggplot2 3.2.1 v purrr 0.3.3
## v tibble 2.1.3 v dplyr 0.8.3
## v tidyr 1.0.2 v stringr 1.4.0
## v readr 1.3.1 v forcats 0.4.0
## -- Conflicts ------------------------------------------------------ tidyverse_conflicts() --
## x dplyr::filter() masks stats::filter()
## x dplyr::lag() masks stats::lag()
library (broom)
library (car)
## Loading required package: carData
##
## Attaching package: 'car'
## The following object is masked from 'package:dplyr':
##
## recode
## The following object is masked from 'package:purrr':
##
## some
library (sjPlot)
## Registered S3 methods overwritten by 'lme4':
## method from
## cooks.distance.influence.merMod car
## influence.merMod car
## dfbeta.influence.merMod car
## dfbetas.influence.merMod car
## Learn more about sjPlot with 'browseVignettes("sjPlot")'.
readfile %
gather (starts_with("19"), starts_with("20"), key = "year", value = salary) %>%
drop_na() %>%
mutate (year_n = parse_number (year))
}
A tabela de dados é baixada do Statistics Sweden. Ele é salvo como um arquivo delimitado por vírgula sem cabeçalho, 000000CY.csv, http://www.statistikdatabasen.scb.se/pxweb/en/ssd/.
Renomeei o arquivo para 000000CY_sector.csv porque o nome do arquivo 000000CY.csv foi usado em uma postagem anterior.
A tabela: Salário básico médio, salário mensal e salário das mulheres como porcentagem do salário de homens por setor, grupo ocupacional (SSYK 2012), sexo e nível de escolaridade (SUN). Ano 2014 – 2018 Salário mensal 1-3 setor público 4-5 setor privado
No gráfico e nas tabelas, também é possível encontrar informações sobre como o aumento dos salários por ano para cada grupo ocupacional é afetado quando as interações são levadas em consideração.
tb %
mutate(edulevel = `level of education`)
numedulevel %
knitr::kable(
booktabs = TRUE,
caption = 'Initial approach, length of education')
nível de educação | eduyears |
---|---|
ensino primário e secundário 9-10 anos (CITE97 2) | 9 |
ensino secundário superior, 2 anos ou menos (CITE97 3C) | 11 |
ensino secundário superior 3 anos (ISCED97 3A) | 12 |
ensino pós-secundário, menos de 3 anos (CITE97 4 + 5B) | 14 |
ensino pós-secundário 3 anos ou mais (CITE97 5A) | 15 |
educação de pós-graduação (ISCED97 6) | 19 |
nenhuma informação sobre o nível de escolaridade | N / D |
tbnum %
right_join(numedulevel, by = c("level of education" = "level.of.education")) %>%
filter(!is.na(eduyears)) %>%
mutate(eduyears = factor(eduyears))
## Warning: Column `level of education`/`level.of.education` joining character
## vector and factor, coercing into character vector
summary_table = vector()
anova_table = vector()
for (i in unique(tbnum$`occuptional (SSYK 2012)`)){
temp 90){
model <- lm(log(salary) ~ edulevel + sex + year_n + sector, data = temp)
summary_table <- rbind (summary_table, mutate (tidy (summary (model)), ssyk = i, interaction = "none"))
anova_table <- rbind (anova_table, mutate (tidy (Anova (model, type = 2)), ssyk = i, interaction = "none"))
model <- lm(log(salary) ~ edulevel * sector + sex + year_n, data = temp)
summary_table <- rbind (summary_table, mutate (tidy (summary (model)), ssyk = i, interaction = "sector and edulevel"))
anova_table <- rbind (anova_table, mutate (tidy (Anova (model, type = 2)), ssyk = i, interaction = "sector and edulevel"))
model <- lm(log(salary) ~ edulevel + sector * sex + year_n, data = temp)
summary_table <- rbind (summary_table, mutate (tidy (summary (model)), ssyk = i, interaction = "sector and sex"))
anova_table <- rbind (anova_table, mutate (tidy (Anova (model, type = 2)), ssyk = i, interaction = "sector and sex"))
model <- lm(log(salary) ~ edulevel + year_n * sector + sex, data = temp)
summary_table <- rbind (summary_table, mutate (tidy (summary (model)), ssyk = i, interaction = "sector and year"))
anova_table <- rbind (anova_table, mutate (tidy (Anova (model, type = 2)), ssyk = i, interaction = "sector and year"))
model <- lm(log(salary) ~ edulevel * sector * sex * year_n, data = temp)
summary_table <- rbind (summary_table, mutate (tidy (summary (model)), ssyk = i, interaction = "sector, year, edulevel and sex"))
anova_table <- rbind (anova_table, mutate (tidy (Anova (model, type = 2)), ssyk = i, interaction = "sector, year, edulevel and sex"))
}
}
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
## Note: model has aliased coefficients
## sums of squares computed by model comparison
anova_table % rowwise() %>% mutate(contcol = str_count(term, ":"))
summary_table % rowwise() %>% mutate(contcol = str_count(term, ":"))
merge(summary_table, anova_table, by = c("ssyk", "interaction"), all = TRUE) %>%
filter (term.x == "year_n") %>%
filter (term.y == "sector") %>%
filter (interaction == "none") %>%
mutate (estimate = (exp(estimate) - 1) * 100) %>%
ggplot () +
geom_point (mapping = aes(x = estimate, y = statistic.y, colour = interaction)) +
labs(
x = "Increase in salaries (% / year)",
y = "F-value for sector"
)
Figura 1: A significância do setor sobre o salário na Suécia, uma comparação entre diferentes grupos ocupacionais, ano 2014 - 2018
merge(summary_table, anova_table, by = c("ssyk", "interaction"), all = TRUE) %>%
filter (term.x == "year_n") %>%
filter (contcol.y > 0) %>%
# only look at the interactions between all four variables in the case with interaction sector, year, edulevel and sex
filter (!(contcol.y %
mutate (estimate = (exp(estimate) - 1) * 100) %>%
ggplot () +
geom_point (mapping = aes(x = estimate, y = statistic.y, colour = interaction)) +
labs(
x = "Increase in salaries (% / year)",
y = "F-value for interaction"
)
Figura 2: A significância da interação entre setor, nível de ensino, ano e sexo no salário na Suécia, uma comparação entre diferentes grupos ocupacionais, ano 2014 - 2018
As tabelas com todos os grupos ocupacionais classificados por valor F em ordem decrescente.
merge(summary_table, anova_table, c("ssyk", "interaction"), all = TRUE) %>%
filter (term.x == "year_n") %>%
filter (term.y == "sector") %>%
filter (interaction == "none") %>%
mutate (estimate = (exp(estimate) - 1) * 100) %>%
select (ssyk, estimate, statistic.y, interaction) %>%
rename (`F-value` = statistic.y) %>%
rename (`Increase in salary` = estimate) %>%
arrange (desc (`F-value`)) %>%
knitr::kable(
booktabs = TRUE,
caption = 'Correlation for F-value (sector) and the yearly increase in salaries')
ssyk | Aumento de salário | Valor F | interação |
---|---|---|---|
242 analistas de organizações, administradores de políticas e especialistas em recursos humanos | 1,609869 | 515.5748558 | Nenhum |
819 Técnicos de controle de processos | 2.250895 | 467.4732796 | Nenhum |
251 arquitetos, analistas de sistemas e gerentes de teste de TIC | 2.217446 | 465.2253589 | Nenhum |
331 Profissionais associados de finanças e contabilidade | 1,964825 | 340.2901702 | Nenhum |
962 Distribuidores de jornais, zeladores e outros prestadores de serviços | 1.971413 | 336.7676606 | Nenhum |
334 Secretários administrativos e especializados | 2.410127 | 333.7196510 | Nenhum |
351 operações de TIC e técnicos de suporte ao usuário | 2,474549 | 305.6052807 | Nenhum |
241 Contadores, analistas financeiros e gestores de fundos | 2.534461 | 251.4058600 | Nenhum |
335 Profissionais associados fiscais e relacionados ao governo | 2.586686 | 250.8147705 | Nenhum |
515 Cuidadores de construção e trabalhadores relacionados | 2.522386 | 250.0742967 | Nenhum |
321 Técnicos médicos e farmacêuticos | 2.493038 | 230.0064060 | Nenhum |
213 Biólogos, farmacologistas e especialistas em agricultura e silvicultura | 2,303600 | 228.0668837 | Nenhum |
134 Gerentes de arquitetura e engenharia | 3.161068 | 226.5669850 | Nenhum |
333 agentes de serviços às empresas | 3.001597 | 222.9774594 | Nenhum |
411 Assistentes de escritório e outros secretários | 2,227235 | 214.6750980 | Nenhum |
243 Profissionais de marketing e relações públicas | 1,481519 | 179.3099186 | Nenhum |
264 Autores, jornalistas e linguistas | 2.046538 | 164.8394018 | Nenhum |
129 Gerentes de administração e serviços não classificados em outra parte | 4.059900 | 158.7687951 | Nenhum |
342 Atletas, instrutores de fitness e trabalhadores recreativos | 1,586943 | 132.1816646 | Nenhum |
159 Outros gerentes de serviços sociais | 2.541205 | 69.9268014 | Nenhum |
123 Gerentes de administração e planejamento | 3.849200 | 50.0164438 | Nenhum |
541 Outros trabalhadores de vigilância e segurança | 2.460130 | 41.9287342 | Nenhum |
235 Profissionais de ensino não classificados em outra parte | 1.415591 | 40.1919620 | Nenhum |
911 Limpadores e ajudantes | 1.938366 | 35.3850213 | Nenhum |
533 Assistentes de saúde | 2.157379 | 22.0488822 | Nenhum |
534 Atendentes, assistentes pessoais e trabalhadores relacionados | 1.959595 | 21.6985964 | Nenhum |
332 Consultores de seguros, agentes de vendas e compras | 2.637486 | 19.1041252 | Nenhum |
131 Gerentes de serviços de tecnologia da informação e comunicação | 4.000609 | 17.0841502 | Nenhum |
311 Técnicos de ciências físicas e de engenharia | 2.325958 | 16.5471030 | Nenhum |
214 profissionais de engenharia | 2.626260 | 15.6152029 | Nenhum |
432 Lojas e funcionários de transporte | 1,231854 | 13.9155189 | Nenhum |
723 Mecânicos e montadores de máquinas | 2,362984 | 12.5847785 | Nenhum |
532 Profissionais de cuidados pessoais em serviços de saúde | 2,906578 | 6.3336230 | Nenhum |
512 Cozinheiros e gerentes de bufê frio | 2,483280 | 5.4612144 | Nenhum |
732 Impressão comercializa trabalhadores | 2.158854 | 5.2405535 | Nenhum |
234 professores de escolas primárias e pré-escolares | 2.985653 | 4.6801860 | Nenhum |
422 Funcionários de informações do cliente | 2.527801 | 1.7881181 | Nenhum |
531 Trabalhadores de cuidados infantis e auxiliares de professores | 1,881615 | 0.8334164 | Nenhum |
611 Jardineiros e cultivadores de mercado | 1.980288 | 0,3732826 | Nenhum |
341 Profissionais de serviço social e religiosos associados | 2,357787 | 0,0276157 | Nenhum |
941 Trabalhadores de fast food, assistentes de preparação de alimentos | 1.981512 | 0,0046670 | Nenhum |
merge(summary_table, anova_table, c("ssyk", "interaction"), all = TRUE) %>%
filter (term.x == "year_n") %>%
filter (contcol.y > 0) %>%
filter (interaction == "sector and sex") %>%
mutate (estimate = (exp(estimate) - 1) * 100) %>%
select (ssyk, estimate, statistic.y, interaction) %>%
rename (`F-value` = statistic.y) %>%
rename (`Increase in salary` = estimate) %>%
arrange (desc (`F-value`)) %>%
knitr::kable(
booktabs = TRUE,
caption = 'Correlation for F-value (sector and sex) and the yearly increase in salaries')
ssyk | Aumento de salário | Valor F | interação |
---|---|---|---|
911 Limpadores e ajudantes | 1.966955 | 183.3539258 | setor e sexo |
331 Profissionais associados de finanças e contabilidade | 1.988628 | 84.3723061 | setor e sexo |
342 Atletas, instrutores de fitness e trabalhadores recreativos | 1.609407 | 53.2856268 | setor e sexo |
351 operações de TIC e técnicos de suporte ao usuário | 2,474549 | 53.1541368 | setor e sexo |
241 Contadores, analistas financeiros e gestores de fundos | 2.549161 | 39.5233707 | setor e sexo |
333 agentes de serviços às empresas | 2,952973 | 32.5926396 | setor e sexo |
611 Jardineiros e cultivadores de mercado | 1.936338 | 25.7248443 | setor e sexo |
243 Profissionais de marketing e relações públicas | 1,489860 | 24.3260135 | setor e sexo |
533 Assistentes de saúde | 2.157379 | 19.0714901 | setor e sexo |
732 Impressão comercializa trabalhadores | 2.207617 | 16.8065594 | setor e sexo |
512 Cozinheiros e gerentes de bufê frio | 2.497408 | 15.7408059 | setor e sexo |
159 Outros gerentes de serviços sociais | 2.511558 | 15.1529257 | setor e sexo |
123 Gerentes de administração e planejamento | 3,819995 | 14.2436097 | setor e sexo |
532 Profissionais de cuidados pessoais em serviços de saúde | 2.899482 | 13.1974037 | setor e sexo |
334 Secretários administrativos e especializados | 2.416957 | 12.8317750 | setor e sexo |
213 Biólogos, farmacologistas e especialistas em agricultura e silvicultura | 2.317893 | 10.2339741 | setor e sexo |
134 Gerentes de arquitetura e engenharia | 3.161068 | 9.7816667 | setor e sexo |
321 Técnicos médicos e farmacêuticos | 2.493038 | 8.6670096 | setor e sexo |
941 Trabalhadores de fast food, assistentes de preparação de alimentos | 1.989465 | 8.6486138 | setor e sexo |
335 Profissionais associados fiscais e relacionados ao governo | 2.586686 | 8.4427211 | setor e sexo |
242 analistas de organizações, administradores de políticas e especialistas em recursos humanos | 1.594999 | 8.1271264 | setor e sexo |
723 Mecânicos e montadores de máquinas | 2.337983 | 6.4299201 | setor e sexo |
332 Consultores de seguros, agentes de vendas e compras | 2.627736 | 5.7400150 | setor e sexo |
311 Técnicos de ciências físicas e de engenharia | 2.316138 | 5.3473607 | setor e sexo |
234 professores de escolas primárias e pré-escolares | 2.999161 | 5.0012138 | setor e sexo |
129 Gerentes de administração e serviços não classificados em outra parte | 4.121066 | 4.6687219 | setor e sexo |
819 Técnicos de controle de processos | 2.250895 | 3.7631281 | setor e sexo |
534 Atendentes, assistentes pessoais e trabalhadores relacionados | 1.959595 | 3.5292601 | setor e sexo |
131 Gerentes de serviços de tecnologia da informação e comunicação | 4.029303 | 2.5233240 | setor e sexo |
264 Autores, jornalistas e linguistas | 2.033203 | 2.5032667 | setor e sexo |
341 Profissionais de serviço social e religiosos associados | 2,357787 | 2.2988889 | setor e sexo |
251 arquitetos, analistas de sistemas e gerentes de teste de TIC | 2.217446 | 2.1823519 | setor e sexo |
422 Funcionários de informações do cliente | 2.519631 | 2.1300830 | setor e sexo |
432 Lojas e funcionários de transporte | 1,231854 | 1.5040767 | setor e sexo |
541 Outros trabalhadores de vigilância e segurança | 2.457007 | 1.3945913 | setor e sexo |
214 profissionais de engenharia | 2,629057 | 1.3225970 | setor e sexo |
962 Distribuidores de jornais, zeladores e outros prestadores de serviços | 1.971413 | 0,3480210 | setor e sexo |
531 Trabalhadores de cuidados infantis e auxiliares de professores | 1.879581 | 0.1432868 | setor e sexo |
515 Cuidadores de construção e trabalhadores relacionados | 2.522844 | 0.1379141 | setor e sexo |
235 Profissionais de ensino não classificados em outra parte | 1.424488 | 0,0670314 | setor e sexo |
411 Assistentes de escritório e outros secretários | 2,227235 | 0.0001653 | setor e sexo |
merge(summary_table, anova_table, c("ssyk", "interaction"), all = TRUE) %>%
filter (term.x == "year_n") %>%
filter (contcol.y > 0) %>%
filter (interaction == "sector and edulevel") %>%
mutate (estimate = (exp(estimate) - 1) * 100) %>%
select (ssyk, estimate, statistic.y, interaction) %>%
rename (`F-value` = statistic.y) %>%
rename (`Increase in salary` = estimate) %>%
arrange (desc (`F-value`)) %>%
knitr::kable(
booktabs = TRUE,
caption = 'Correlation for F-value (sector and edulevel) and the yearly increase in salaries')
ssyk | Aumento de salário | Valor F | interação |
---|---|---|---|
335 Profissionais associados fiscais e relacionados ao governo | 2.586686 | 48.2902588 | setor e nível educacional |
234 professores de escolas primárias e pré-escolares | 2.936162 | 32.3560802 | setor e nível educacional |
214 profissionais de engenharia | 2.636843 | 29.4462376 | setor e nível educacional |
332 Consultores de seguros, agentes de vendas e compras | 2.420632 | 26.7105578 | setor e nível educacional |
432 Lojas e funcionários de transporte | 1,231854 | 24.9194979 | setor e nível educacional |
134 Gerentes de arquitetura e engenharia | 3.161068 | 20.3665858 | setor e nível educacional |
321 Técnicos médicos e farmacêuticos | 2.493038 | 18.1556092 | setor e nível educacional |
723 Mecânicos e montadores de máquinas | 2.358171 | 17.3272819 | setor e nível educacional |
311 Técnicos de ciências físicas e de engenharia | 2.330300 | 12.9686992 | setor e nível educacional |
123 Gerentes de administração e planejamento | 3.809019 | 11.7436022 | setor e nível educacional |
732 Impressão comercializa trabalhadores | 2.220728 | 11.0453452 | setor e nível educacional |
241 Contadores, analistas financeiros e gestores de fundos | 2,647068 | 10.5100504 | setor e nível educacional |
235 Profissionais de ensino não classificados em outra parte | 1,396076 | 8.6264575 | setor e nível educacional |
213 Biólogos, farmacologistas e especialistas em agricultura e silvicultura | 2,264110 | 7.7952190 | setor e nível educacional |
941 Trabalhadores de fast food, assistentes de preparação de alimentos | 1.981512 | 7.5766373 | setor e nível educacional |
331 Profissionais associados de finanças e contabilidade | 1.980338 | 6.9758948 | setor e nível educacional |
532 Profissionais de cuidados pessoais em serviços de saúde | 2.919933 | 6.6231457 | setor e nível educacional |
534 Atendentes, assistentes pessoais e trabalhadores relacionados | 1.959595 | 5.7464596 | setor e nível educacional |
962 Distribuidores de jornais, zeladores e outros prestadores de serviços | 1.971413 | 5.4435379 | setor e nível educacional |
131 Gerentes de serviços de tecnologia da informação e comunicação | 3,908111 | 4.9661376 | setor e nível educacional |
159 Outros gerentes de serviços sociais | 2.565523 | 4.7197836 | setor e nível educacional |
129 Gerentes de administração e serviços não classificados em outra parte | 4.160995 | 4.3062655 | setor e nível educacional |
251 arquitetos, analistas de sistemas e gerentes de teste de TIC | 2.209131 | 3.5539841 | setor e nível educacional |
512 Cozinheiros e gerentes de bufê frio | 2.435903 | 3.4242806 | setor e nível educacional |
333 agentes de serviços às empresas | 2.955970 | 3.3635706 | setor e nível educacional |
243 Profissionais de marketing e relações públicas | 1,473064 | 3,2639790 | setor e nível educacional |
264 Autores, jornalistas e linguistas | 2.043677 | 3.0449469 | setor e nível educacional |
334 Secretários administrativos e especializados | 2,387467 | 2.8528940 | setor e nível educacional |
422 Funcionários de informações do cliente | 2.527801 | 2.3007696 | setor e nível educacional |
242 analistas de organizações, administradores de políticas e especialistas em recursos humanos | 1.612900 | 1.9599904 | setor e nível educacional |
351 operações de TIC e técnicos de suporte ao usuário | 2,474549 | 1.5903279 | setor e nível educacional |
819 Técnicos de controle de processos | 2.250895 | 1.5586112 | setor e nível educacional |
341 Profissionais de serviço social e religiosos associados | 2,357787 | 1.3263497 | setor e nível educacional |
611 Jardineiros e cultivadores de mercado | 2.016345 | 1.2719035 | setor e nível educacional |
541 Outros trabalhadores de vigilância e segurança | 2.460130 | 1.0672924 | setor e nível educacional |
411 Assistentes de escritório e outros secretários | 2,227235 | 1.0114046 | setor e nível educacional |
515 Cuidadores de construção e trabalhadores relacionados | 2.526100 | 0.8254389 | setor e nível educacional |
342 Atletas, instrutores de fitness e trabalhadores recreativos | 1.540952 | 0,8230839 | setor e nível educacional |
531 Trabalhadores de cuidados infantis e auxiliares de professores | 1.897863 | 0.7969406 | setor e nível educacional |
533 Assistentes de saúde | 2.157379 | 0,5425248 | setor e nível educacional |
911 Limpadores e ajudantes | 1.938366 | 0,0965584 | setor e nível educacional |
merge(summary_table, anova_table, c("ssyk", "interaction"), all = TRUE) %>%
filter (term.x == "year_n") %>%
filter (contcol.y > 0) %>%
filter (interaction == "sector and year") %>%
mutate (estimate = (exp(estimate) - 1) * 100) %>%
select (ssyk, estimate, statistic.y, interaction) %>%
rename (`F-value` = statistic.y) %>%
rename (`Increase in salary` = estimate) %>%
arrange (desc (`F-value`)) %>%
knitr::kable(
booktabs = TRUE,
caption = 'Correlation for F-value (sector and year) and the yearly increase in salaries')
ssyk | Aumento de salário | Valor F | interação |
---|---|---|---|
129 Gerentes de administração e serviços não classificados em outra parte | 5.8528187 | 17.1667457 | setor e ano |
351 operações de TIC e técnicos de suporte ao usuário | 3.2455362 | 16.6101284 | setor e ano |
334 Secretários administrativos e especializados | 1.0672775 | 14.9508269 | setor e ano |
534 Atendentes, assistentes pessoais e trabalhadores relacionados | 2.2769477 | 12.4036331 | setor e ano |
422 Funcionários de informações do cliente | 3,2733483 | 11.6812523 | setor e ano |
962 Distribuidores de jornais, zeladores e outros prestadores de serviços | 2.4907346 | 11.5673142 | setor e ano |
264 Autores, jornalistas e linguistas | 2.9905121 | 10.5945994 | setor e ano |
531 Trabalhadores de cuidados infantis e auxiliares de professores | 2.4510286 | 9.5936100 | setor e ano |
242 analistas de organizações, administradores de políticas e especialistas em recursos humanos | 2.3355826 | 7.7816291 | setor e ano |
432 Lojas e funcionários de transporte | 0.5332567 | 7.4196762 | setor e ano |
243 Profissionais de marketing e relações públicas | 2.1828057 | 5.5660180 | setor e ano |
732 Impressão comercializa trabalhadores | 2,8825380 | 4.3716553 | setor e ano |
213 Biólogos, farmacologistas e especialistas em agricultura e silvicultura | 2.8099783 | 3.6786224 | setor e ano |
611 Jardineiros e cultivadores de mercado | 2.3161238 | 3,3017939 | setor e ano |
131 Gerentes de serviços de tecnologia da informação e comunicação | 3.3504930 | 2.8750373 | setor e ano |
532 Profissionais de cuidados pessoais em serviços de saúde | 2.7411030 | 2.8290655 | setor e ano |
235 Profissionais de ensino não classificados em outra parte | 1.8047571 | 2.7841902 | setor e ano |
311 Técnicos de ciências físicas e de engenharia | 2.8608741 | 2.6173373 | setor e ano |
533 Assistentes de saúde | 1.9920113 | 2.2486864 | setor e ano |
214 profissionais de engenharia | 3.0209963 | 2.0446973 | setor e ano |
723 Mecânicos e montadores de máquinas | 2.6258864 | 1.4272778 | setor e ano |
515 Cuidadores de construção e trabalhadores relacionados | 2.3423357 | 1.3492650 | setor e ano |
321 Técnicos médicos e farmacêuticos | 2.1376334 | 1.2494762 | setor e ano |
941 Trabalhadores de fast food, assistentes de preparação de alimentos | 2.1906312 | 1.1458297 | setor e ano |
234 professores de escolas primárias e pré-escolares | 3.1522849 | 0.8075167 | setor e ano |
411 Assistentes de escritório e outros secretários | 2.4217447 | 0.7799156 | setor e ano |
241 Contadores, analistas financeiros e gestores de fundos | 2,2625663 | 0.7751592 | setor e ano |
541 Outros trabalhadores de vigilância e segurança | 2.3018747 | 0.6646888 | setor e ano |
134 Gerentes de arquitetura e engenharia | 3.3811821 | 0.5852232 | setor e ano |
333 agentes de serviços às empresas | 3.2520012 | 0,5424390 | setor e ano |
335 Profissionais associados fiscais e relacionados ao governo | 2.3986233 | 0,3139375 | setor e ano |
123 Gerentes de administração e planejamento | 4.0945884 | 0,2682143 | setor e ano |
911 Limpadores e ajudantes | 2.0082873 | 0,2021948 | setor e ano |
341 Profissionais de serviço social e religiosos associados | 2.3994292 | 0,0754320 | setor e ano |
342 Atletas, instrutores de fitness e trabalhadores recreativos | 1.6673896 | 0,0633281 | setor e ano |
512 Cozinheiros e gerentes de bufê frio | 2.4249631 | 0,0494622 | setor e ano |
819 Técnicos de controle de processos | 2.2225873 | 0,0378303 | setor e ano |
331 Profissionais associados de finanças e contabilidade | 2.0557505 | 0,0377336 | setor e ano |
251 arquitetos, analistas de sistemas e gerentes de teste de TIC | 2.2536138 | 0,0294035 | setor e ano |
332 Consultores de seguros, agentes de vendas e compras | 2.6015664 | 0,0125275 | setor e ano |
159 Outros gerentes de serviços sociais | 2.5487758 | 0,0013436 | setor e ano |
merge(summary_table, anova_table, c("ssyk", "interaction"), all = TRUE) %>%
filter (term.x == "year_n") %>%
filter (contcol.y > 1) %>%
filter (interaction == "sector, year, edulevel and sex") %>%
filter (!(contcol.y %
mutate (estimate = (exp(estimate) - 1) * 100) %>%
select (ssyk, estimate, statistic.y, interaction) %>%
rename (`F-value` = statistic.y) %>%
rename (`Increase in salary` = estimate) %>%
arrange (desc (`F-value`)) %>%
knitr::kable(
booktabs = TRUE,
caption = 'Correlation for F-value (sector, year, edulevel and sex) and the yearly increase in salaries')
ssyk | Aumento de salário | Valor F | interação |
---|---|---|---|
264 Autores, jornalistas e linguistas | 2.0717871 | 5.0646298 | setor, ano, nível educacional e sexo |
311 Técnicos de ciências físicas e de engenharia | -1.9358596 | 3.3593399 | setor, ano, nível educacional e sexo |
159 Outros gerentes de serviços sociais | 2.1339049 | 2.5206357 | setor, ano, nível educacional e sexo |
134 Gerentes de arquitetura e engenharia | -0,2221716 | 2,4150753 | setor, ano, nível educacional e sexo |
331 Profissionais associados de finanças e contabilidade | 0,2989757 | 2.2892768 | setor, ano, nível educacional e sexo |
342 Atletas, instrutores de fitness e trabalhadores recreativos | 2.7799167 | 2.1976399 | setor, ano, nível educacional e sexo |
214 profissionais de engenharia | 5.2732904 | 1.9988132 | setor, ano, nível educacional e sexo |
723 Mecânicos e montadores de máquinas | 2.1334983 | 1.8843643 | setor, ano, nível educacional e sexo |
432 Lojas e funcionários de transporte | -0,2883737 | 1,8215339 | setor, ano, nível educacional e sexo |
241 Contadores, analistas financeiros e gestores de fundos | 2.6268377 | 1.8184489 | setor, ano, nível educacional e sexo |
533 Assistentes de saúde | 1.3176280 | 1.6357939 | setor, ano, nível educacional e sexo |
911 Limpadores e ajudantes | 1.1875630 | 1,6319874 | setor, ano, nível educacional e sexo |
129 Gerentes de administração e serviços não classificados em outra parte | 16.0932403 | 1,5716145 | setor, ano, nível educacional e sexo |
512 Cozinheiros e gerentes de bufê frio | 2.2335677 | 1.4882138 | setor, ano, nível educacional e sexo |
242 analistas de organizações, administradores de políticas e especialistas em recursos humanos | 1.9377802 | 1.4494844 | setor, ano, nível educacional e sexo |
234 professores de escolas primárias e pré-escolares | 2.6286211 | 1.4408203 | setor, ano, nível educacional e sexo |
235 Profissionais de ensino não classificados em outra parte | 1.4806649 | 1.4162230 | setor, ano, nível educacional e sexo |
532 Profissionais de cuidados pessoais em serviços de saúde | 3.0809717 | 1.3439893 | setor, ano, nível educacional e sexo |
962 Distribuidores de jornais, zeladores e outros prestadores de serviços | 1,7217534 | 1.3344044 | setor, ano, nível educacional e sexo |
332 Consultores de seguros, agentes de vendas e compras | 4.5515134 | 0.9604905 | setor, ano, nível educacional e sexo |
123 Gerentes de administração e planejamento | 1.6860436 | 0.9155189 | setor, ano, nível educacional e sexo |
541 Outros trabalhadores de vigilância e segurança | 3.1372549 | 0.9113280 | setor, ano, nível educacional e sexo |
213 Biólogos, farmacologistas e especialistas em agricultura e silvicultura | 2.0956711 | 0.9044780 | setor, ano, nível educacional e sexo |
422 Funcionários de informações do cliente | 7.6231100 | 0.8611877 | setor, ano, nível educacional e sexo |
515 Cuidadores de construção e trabalhadores relacionados | 3.8284291 | 0.8343329 | setor, ano, nível educacional e sexo |
334 Secretários administrativos e especializados | -1.8021942 | 0.7940149 | setor, ano, nível educacional e sexo |
531 Trabalhadores de cuidados infantis e auxiliares de professores | 2.9556278 | 0.7580341 | setor, ano, nível educacional e sexo |
131 Gerentes de serviços de tecnologia da informação e comunicação | 6.2536436 | 0,7429188 | setor, ano, nível educacional e sexo |
243 Profissionais de marketing e relações públicas | -0.7939038 | 0.7338409 | setor, ano, nível educacional e sexo |
351 operações de TIC e técnicos de suporte ao usuário | 3.2312302 | 0.7188959 | setor, ano, nível educacional e sexo |
732 Impressão comercializa trabalhadores | 3.9993823 | 0.6905319 | setor, ano, nível educacional e sexo |
321 Técnicos médicos e farmacêuticos | 2.2164674 | 0.6326293 | setor, ano, nível educacional e sexo |
611 Jardineiros e cultivadores de mercado | 2.2753348 | 0.6157880 | setor, ano, nível educacional e sexo |
341 Profissionais de serviço social e religiosos associados | 3.0666620 | 0.5266982 | setor, ano, nível educacional e sexo |
941 Trabalhadores de fast food, assistentes de preparação de alimentos | 2.7940568 | 0.4253642 | setor, ano, nível educacional e sexo |
335 Profissionais associados fiscais e relacionados ao governo | 5.0470456 | 0,3217115 | setor, ano, nível educacional e sexo |
251 arquitetos, analistas de sistemas e gerentes de teste de TIC | 2.9031256 | 0,2684425 | setor, ano, nível educacional e sexo |
819 Técnicos de controle de processos | 1.6741717 | 0.2603997 | setor, ano, nível educacional e sexo |
333 agentes de serviços às empresas | 1.8143344 | 0.1540308 | setor, ano, nível educacional e sexo |
411 Assistentes de escritório e outros secretários | 5.5231019 | 0,0911334 | setor, ano, nível educacional e sexo |
534 Atendentes, assistentes pessoais e trabalhadores relacionados | 2,6927719 | 0,0899580 | setor, ano, nível educacional e sexo |
Vamos verificar o que encontramos.
temp %
filter(`occuptional (SSYK 2012)` == "242 Organisation analysts, policy administrators and human resource specialists")
model <- lm (log(salary) ~ year_n + eduyears + sector + sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "sector"))
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 3: Setor de maior valor F, analistas da organização, administradores de políticas e especialistas em recursos humanos
temp %
filter(`occuptional (SSYK 2012)` == "941 Fast-food workers, food preparation assistants")
model <-lm (log(salary) ~ year_n + eduyears + sector + sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "sector"))
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 4: Setor de menor valor F, trabalhadores de fast-food, assistentes de preparação de alimentos
temp %
filter(`occuptional (SSYK 2012)` == "911 Cleaners and helpers")
model <- lm (log(salary) ~ year_n + eduyears + sector * sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "sex", "sector"))
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 5: Setor de interação com maior valor F e gênero, Produtos de limpeza e ajudantes
temp %
filter(`occuptional (SSYK 2012)` == "411 Office assistants and other secretaries")
model <- lm (log(salary) ~ year_n + eduyears + sector * sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "sex", "sector"))
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 6: Setor de interação com menor valor de F e gênero, assistentes do escritório e outros secretários
temp %
filter(`occuptional (SSYK 2012)` == "335 Tax and related government associate professionals")
model <- lm (log(salary) ~ year_n + eduyears * sector + sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "sector"))
## Warning in predict.lm(model, newdata = fitfram, type = "response", se.fit =
## se, : prediction from a rank-deficient fit may be misleading
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 7: Setor de interação com maior valor F e nível profissional, profissionais associados a impostos e governos relacionados
temp %
filter(`occuptional (SSYK 2012)` == "911 Cleaners and helpers")
model <- lm (log(salary) ~ year_n + eduyears * sector + sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "sector"))
## Warning in predict.lm(model, newdata = fitfram, type = "response", se.fit =
## se, : prediction from a rank-deficient fit may be misleading
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 8: Setor de interação de menor valor F e nível de nível, Produtos de limpeza e ajudantes
temp %
filter(`occuptional (SSYK 2012)` == "129 Administration and service managers not elsewhere classified")
model <- lm (log(salary) ~ year_n * sector + eduyears + sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "year_n", "sector"))
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 9: Setor de interação com valor F mais alto e ano, gerentes de administração e serviços não classificados em outra parte
temp %
filter(`occuptional (SSYK 2012)` == "159 Other social services managers")
model <- lm (log(salary) ~ year_n * sector + eduyears + sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "year_n", "sector"))
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 10: Setor de interação com menor valor F e ano, Outros gerentes de serviços sociais
temp %
filter(`occuptional (SSYK 2012)` == "264 Authors, journalists and linguists")
model <- lm (log(salary) ~ year_n * eduyears * sector * sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "year_n", "sex", "sector"))
## Warning in predict.lm(model, newdata = fitfram, type = "response", se.fit =
## se, : prediction from a rank-deficient fit may be misleading
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 11: Setor de interação com valor F mais alto, nível de ensino, ano e gênero, Autores, jornalistas e linguistas
## TableGrob (2 x 1) "arrange": 2 grobs
## z cells name grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (2-2,1-1) arrange gtable[layout]
temp %
filter(`occuptional (SSYK 2012)` == "534 Attendants, personal assistants and related workers")
model <- lm (log(salary) ~ year_n * eduyears * sector * sex, data = temp)
plot_model(model, type = "pred", terms = c("eduyears", "year_n", "sex", "sector"))
## Warning in predict.lm(model, newdata = fitfram, type = "response", se.fit =
## se, : prediction from a rank-deficient fit may be misleading
## Model has log-transformed response. Back-transforming predictions to original response scale. Standard errors are still on the log-scale.
Figura 12: Setor de interação de menor valor F, nível de ensino, ano e gênero, Atendentes, assistentes pessoais e trabalhadores relacionados
## TableGrob (2 x 1) "arrange": 2 grobs
## z cells name grob
## 1 1 (1-1,1-1) arrange gtable[layout]
## 2 2 (2-2,1-1) arrange gtable[layout]
var vglnk = {key: '949efb41171ac6ec1bf7f206d57e90b8'};
(função (d, t) {
var s = d.createElement
s.src = '//cdn.viglink.com/api/vglnk.js';
var r = d.getElementsByTagName
} (documento, 'script'));
R Analystatistics Sweden
R-bloggers.com oferece atualizações diárias por email sobre notícias e tutoriais do R sobre o aprendizado do R e muitos outros tópicos. Clique aqui se você deseja publicar ou encontrar um emprego em ciência da dados / R.
Deseja compartilhar seu conteúdo com R-blogueiros? clique aqui se você tiver um blog ou aqui se não tiver.