Bu calismada 2017.Kasim itibari ile TOP 500 listesinde yayinlanan[1] en guclu Super Bilgisayarlar listesinden yararlanilarak giris seviyesinde bir R calismasi yapilmistir.

Hazırlık

library(tidyverse)
## ── Attaching packages ────────────────────────────────────────────────────────────────────────────────────── tidyverse 1.2.1 ──
## ✔ ggplot2 2.2.1     ✔ purrr   0.2.4
## ✔ tibble  1.4.2     ✔ dplyr   0.7.4
## ✔ tidyr   0.7.2     ✔ stringr 1.2.0
## ✔ readr   1.1.1     ✔ forcats 0.2.0
## ── Conflicts ───────────────────────────────────────────────────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
library(readxl)
# Bu kisimda oncelikle [1] den alinan verilerin Excel dosyasindan alinmistir

ham_veri <- read_excel("/Users/cenkatlig/Super_Bilgisayar.xlsx") %>% tbl_df()


# Daha sonra Ham olan verileri daha duzgun bir hale getirerek
# Her satira ayrica yazilmasi saglanmistir (orjinalde sistemler 2 ser satirdi)

ara_veri <-
  ham_veri %>% 
    slice(seq(1,nrow(.),by=2)) %>% 
      cbind(.,ham_veri %>% slice(seq(2,nrow(.),by=2)) %>% select(Country=Site,Company=System)) %>% mutate_at(vars(Cores:`Power (kW)`),funs(as.numeric(gsub(",","",.)))) %>% tbl_df()

# ara_veri
# ggplot(ara_veri, aes(x = Site, y = Country)) + geom_point()
# country_list <- ara_veri %>% filter(Country == "United States" & Rank < 100 )
# ggplot(country_list, aes(x = Rank, y = Cores)) + geom_point()
ggplot(ara_veri,aes(x=Country)) + geom_bar() + theme(axis.text.x = element_text(angle=90,hjust = 1))

company_list <- ara_veri %>% filter(Company == "IBM" & Rank < 100 )

ggplot(company_list, aes(x=Company)) + geom_bar() # + theme(axis.text.x = element_text(angle=90,hjust = 1))

  # ABD'den ilk 100 e giren sistem sayısı
country_list_100_US <- ara_veri %>% filter(Country == "United States" & Rank < 10 )

ggplot(country_list_100_US, aes(x = System)) + geom_bar(fill = "white", colour = "green") + theme(axis.text.x = element_text(angle=30, hjust = 1))

# theme_stata() 
  # CiN, Japon, ABD olmayan SiRKETlere gore Sistem sayisi
Non_CN_JP_US <- ara_veri %>% filter(Country != "Japan" & Country != "United States" & Country != "China")

ggplot(Non_CN_JP_US, aes(x=Company)) + geom_bar(fill = "white", colour = "red") + theme(axis.text.x = element_text(angle=45,hjust = 1))  +
  ggtitle("CiN, Japon, ABD olmayan SiRKETlere gore Sistem sayisi") 

minimum_core = min(ara_veri$Cores)
max_core = max(ara_veri$Cores)

message("En az CEKiRDEK (Core) SAYISI: ", minimum_core)
## En az CEKiRDEK (Core) SAYISI: 9.792
message("En fazla CEKiRDEK (Core) SAYISI: ", max_core)
## En fazla CEKiRDEK (Core) SAYISI: 19860000
minimum_enerji = min(ara_veri$`Power (kW)`,na.rm=TRUE)
max_enerji = max(ara_veri$`Power (kW)`,na.rm=TRUE)

message("En az ENERJi TUKETEN SiSTEMiN TUKETiM MiKTARI (kW): ", minimum_enerji)
## En az ENERJi TUKETEN SiSTEMiN TUKETiM MiKTARI (kW): 1
message("En fazla ENERJi TUKETEN SiSTEMiN TUKETiM MiKTARI (kW): ", max_enerji)
## En fazla ENERJi TUKETEN SiSTEMiN TUKETiM MiKTARI (kW): 997

KAYNAKLAR

[1] TOP 500, Super Bilgisayar Listesi, 2017.Kasim, https://www.top500.org/list/2017/11/?page=1 (son erisim: 30-Ocak-2018)

[2] Orbay, B., Baydogan, M., R ile Veri Analizi ders notlari, Akademik Bilisim 2018, Karabuk, 2018.Ocak.