aa179c3e8d3f4ab1b0468da3c2dae97a2ddc3bdd
[projects/modsched/linux.git] / kernel / sched.new / core.c
1 /*
2  *  kernel/sched/core.c
3  *
4  *  Kernel scheduler and related syscalls
5  *
6  *  Copyright (C) 1991-2002  Linus Torvalds
7  *
8  *
9  */
10
11 /**
12  * TODO:  2)        Input from register are not printed on the screen although corresponding
13  *                  interrupts are called. After the serial interrupt a thread (0xffff880007054cc0)
14  *                  is activated, which is probably responsible for the output. In our case that thread
15  *                  is already running, which should be not a problem. At the end a tty function (n_tty_write)
16  *                  must be called, which is not, in order to print the input.
17  *
18  *        3)        While boot up we encounter a kernel stack overflow, which seems to come randomly. Linux
19  *                  stack overflow checker gives us a warning but its to late to back trace.
20  *                  Maybe we should fix this one first in order to be sure that there are no side effects produced
21  *                  by this "error".
22  *
23  *        4)        We need to strip down clock.c since we use the default linux implementation.
24  */
25
26 #include <linux/init.h>
27 #include <asm/mmu_context.h>
28 #include <linux/completion.h>
29 #include <linux/kernel_stat.h>
30 #include <linux/blkdev.h>
31 #include <linux/syscalls.h>
32 #include <linux/kprobes.h>
33 #include <linux/delayacct.h>
34 #include <linux/export.h>
35 #include <linux/context_tracking.h>
36 #include <linux/kthread.h>
37 #include <linux/init_task.h>
38
39 #include <asm/switch_to.h>
40 #include <asm/tlb.h>
41 #include <linux/cgroup.h>
42 #include "sched.h"
43 #include "../workqueue_internal.h"
44 #include "../smpboot.h"
45
46 /*
47  * FRAMEWORK STUFF
48  */
49 //void init_modsched_framework(void* idletask);
50 void fw_init(void);
51 void *send_to_topic(int topic_id, void *ptr);
52
53 //
54 // Variables
55 //
56
57 /*
58  * kernel/sched/rt.c:10
59  * default timeslice is 100 msecs (used only for SCHED_RR tasks).
60  * Timeslices get refilled after they expire. RR_TIMESLICE is defined as
61  * (100 * HZ / 1000) and is assigned to sched_rr_timeslice.
62  */
63 int sched_rr_timeslice = RR_TIMESLICE;
64
65 /*
66  * kernel/sched/fair.c:80
67  * After fork, child runs first. If set to 0 (default) then
68  * parent will (try to) run first.
69  */
70 unsigned int sysctl_sched_child_runs_first = 0;
71
72 /*
73  * kernel/sched/core.c:289
74  * Period over which we measure -rt task cpu usage in us.
75  * default: 1s (1000000)
76  */
77 unsigned int sysctl_sched_rt_period = 1000000;
78
79 /*
80  * /kernel/sched/core.c:2081
81  * Variables and functions for calc_load
82  */
83 unsigned long avenrun[3];
84
85 /*
86  * kernel/sched/core.c:297
87  * part of the period that we allow rt tasks to run in us.
88  * default: 0.95s (950000)
89  */
90 int sysctl_sched_rt_runtime = 950000;
91
92 /*
93  * /kernel/sched/core.c:6866
94  *
95  */
96 struct task_group root_task_group;
97
98 /*
99  * /kernel/sched/core.c:6582
100  * Special case: If a kmalloc of a doms_cur partition (array of
101  * cpumask) fails, then fallback to a single sched domain,
102  * as determined by the single cpumask fallback_doms.
103  */
104 static cpumask_var_t fallback_doms;
105
106 /*
107  * /kernel/sched/core.c:5682
108  * cpus with isolated domains
109  */
110 static cpumask_var_t cpu_isolated_map;
111
112 /*
113  * /kernel/sched/core.c:5323
114  */
115 DEFINE_PER_CPU(int, sd_llc_id);
116
117 /*
118  * /kernel/sched/core.c:2623
119  * unknown
120  */
121 DEFINE_PER_CPU(struct kernel_stat, kstat);
122 DEFINE_PER_CPU(struct kernel_cpustat, kernel_cpustat);
123
124
125 /*
126  * /kernel/sched/core.c:291
127  */
128 __read_mostly int scheduler_running;
129
130 /*
131  * kernel/sched/core.c:113
132  */
133 DEFINE_MUTEX(sched_domains_mutex);
134 DEFINE_PER_CPU_SHARED_ALIGNED(struct rq, runqueues);
135
136
137
138 /*
139  * __task_rq_lock - lock the rq @p resides on.
140  */
141 static inline struct rq *__task_rq_lock(struct task_struct *p)
142         __acquires(rq->lock)
143 {
144         struct rq *rq;
145
146         lockdep_assert_held(&p->pi_lock);
147
148         for (;;) {
149                 rq = task_rq(p);
150                 raw_spin_lock(&rq->lock);
151                 if (likely(rq == task_rq(p)))
152                         return rq;
153                 raw_spin_unlock(&rq->lock);
154         }
155 }
156
157
158
159 /*
160  * Lock/unlock task from runqueue
161  */
162
163 /*
164  * task_rq_lock - lock p->pi_lock and lock the rq @p resides on.
165  */
166 static struct rq *task_rq_lock(struct task_struct *p, unsigned long *flags)
167         __acquires(p->pi_lock)
168         __acquires(rq->lock)
169 {
170         struct rq *rq;
171
172         for (;;) {
173                 raw_spin_lock_irqsave(&p->pi_lock, *flags);
174                 rq = task_rq(p);
175                 raw_spin_lock(&rq->lock);
176                 if (likely(rq == task_rq(p)))
177                         return rq;
178                 raw_spin_unlock(&rq->lock);
179                 raw_spin_unlock_irqrestore(&p->pi_lock, *flags);
180         }
181 }
182
183 static void __task_rq_unlock(struct rq *rq)
184         __releases(rq->lock)
185 {
186         raw_spin_unlock(&rq->lock);
187 }
188
189 static inline void
190 task_rq_unlock(struct rq *rq, struct task_struct *p, unsigned long *flags)
191         __releases(rq->lock)
192         __releases(p->pi_lock)
193 {
194         raw_spin_unlock(&rq->lock);
195         raw_spin_unlock_irqrestore(&p->pi_lock, *flags);
196 }
197
198 ///*
199 // * this_rq_lock - lock this runqueue and disable interrupts.
200 // */
201 //static struct rq *this_rq_lock(void)
202 //      __acquires(rq->lock)
203 //{
204 //      struct rq *rq;
205 //
206 //      local_irq_disable();
207 //      rq = this_rq();
208 //      raw_spin_lock(&rq->lock);
209 //
210 //      return rq;
211 //}
212
213
214
215 /*
216  * Functions
217  */
218
219 /**
220  * kernel/sched/core.c:6872
221  * Initialize the scheduler
222  */
223 void sched_init(void)
224 {
225         int i;
226         unsigned long alloc_size = 0, ptr;
227
228 #ifdef CONFIG_CPUMASK_OFFSTACK
229         alloc_size += num_possible_cpus() * cpumask_size();
230 #endif
231         if (alloc_size) {
232                 ptr = (unsigned long)kzalloc(alloc_size, GFP_NOWAIT);
233         }
234
235         // TODO: SMP
236 //#ifdef CONFIG_SMP
237 //      init_defrootdomain();
238 //#endif
239
240 //      init_rt_bandwidth(&def_rt_bandwidth,
241 //                      global_rt_period(), global_rt_runtime());
242
243         for_each_possible_cpu(i) {
244                 struct rq *rq;
245
246                 rq = cpu_rq(i);
247                 raw_spin_lock_init(&rq->lock);
248                 rq->nr_running = 0;
249                 INIT_LIST_HEAD(&rq->rq_list);
250
251 //              rq->calc_load_active = 0;
252 //              rq->calc_load_update = jiffies + LOAD_FREQ;
253
254 //              init_cfs_rq(&rq->cfs);
255 //              init_rt_rq(&rq->rt, rq);
256
257 //              rq->rt.rt_runtime = def_rt_bandwidth.rt_runtime;
258
259 //              for (j = 0; j < CPU_LOAD_IDX_MAX; j++)
260 //                      rq->cpu_load[j] = 0;
261
262 //              rq->last_load_update_tick = jiffies;
263
264 #ifdef CONFIG_SMP
265 //              rq->sd = NULL;
266 //              rq->rd = NULL;
267 ////            rq->cpu_power = SCHED_POWER_SCALE;
268 //              rq->post_schedule = 0;
269 ////            rq->active_balance = 0;
270 ////            rq->next_balance = jiffies;
271 //              rq->push_cpu = 0;
272                 rq->cpu = i;
273                 rq->online = 0;
274 ////            rq->idle_stamp = 0;
275 ////            rq->avg_idle = 2*sysctl_sched_migration_cost;
276 //
277 //              INIT_LIST_HEAD(&rq->cfs_tasks);
278 //
279 //              rq_attach_root(rq, &def_root_domain);
280 //#ifdef CONFIG_NO_HZ
281 //              rq->nohz_flags = 0;
282 //#endif
283 #endif
284 //              init_rq_hrtick(rq);
285                 atomic_set(&rq->nr_iowait, 0);
286         }
287
288 //      set_load_weight(&init_task);
289
290         /*
291          * The boot idle thread does lazy MMU switching as well:
292          */
293         atomic_inc(&init_mm.mm_count);
294         enter_lazy_tlb(&init_mm, current);
295
296         /*
297          * Make us the idle thread. Technically, schedule() should not be
298          * called from this thread, however somewhere below it might be,
299          * but because we are the idle thread, we just pick up running again
300          * when this runqueue becomes "idle".
301          */
302         init_idle(current, smp_processor_id());
303
304 //      calc_load_update = jiffies + LOAD_FREQ;
305
306         /*
307          * During early bootup we pretend to be a normal task:
308          */
309 //      current->sched_class = &fair_sched_class;
310
311 #ifdef CONFIG_SMP
312         idle_thread_set_boot_cpu();
313 #endif
314 //      init_sched_fair_class();
315
316         fw_init();
317
318         scheduler_running = 1;
319 }
320
321 #ifdef CONFIG_DEBUG_ATOMIC_SLEEP
322 static inline int preempt_count_equals(int preempt_offset)
323 {
324         int nested = (preempt_count() & ~PREEMPT_ACTIVE) + rcu_preempt_depth();
325
326         return (nested == preempt_offset);
327 }
328
329 void __might_sleep(const char *file, int line, int preempt_offset)
330 {
331         static unsigned long prev_jiffy;        /* ratelimiting */
332
333         rcu_sleep_check(); /* WARN_ON_ONCE() by default, no rate limit reqd. */
334         if ((preempt_count_equals(preempt_offset) && !irqs_disabled()) ||
335             system_state != SYSTEM_RUNNING || oops_in_progress)
336                 return;
337         if (time_before(jiffies, prev_jiffy + HZ) && prev_jiffy)
338                 return;
339         prev_jiffy = jiffies;
340
341         printk(KERN_ERR
342                 "BUG: sleeping function called from invalid context at %s:%d\n",
343                         file, line);
344         printk(KERN_ERR
345                 "in_atomic(): %d, irqs_disabled(): %d, pid: %d, name: %s\n",
346                         in_atomic(), irqs_disabled(),
347                         current->pid, current->comm);
348
349         debug_show_held_locks(current);
350         if (irqs_disabled())
351                 print_irqtrace_events(current);
352         dump_stack();
353 }
354 EXPORT_SYMBOL(__might_sleep);
355 #endif
356
357 /*
358  * kernel/sched/core.c:1560
359  * Perform scheduler related setup for a newly forked process p.
360  * p is forked by current.
361  *
362  * __sched_fork() is basic setup used by init_idle() too:
363  */
364 static void __sched_fork(struct task_struct *p)
365 {
366         p->on_rq                                        = 0;
367
368         p->se.on_rq                                     = 0;
369         p->se.exec_start                        = 0;
370         p->se.sum_exec_runtime          = 0;
371         p->se.prev_sum_exec_runtime     = 0;
372         p->se.vruntime                          = 0;
373 }
374
375 /*
376  * kernel/sched/core.c:1622
377  * fork()/clone()-time setup:
378  */
379 void sched_fork(struct task_struct *p)
380 {
381 //      printk(">>sched_fork\n");
382         unsigned long flags;
383         int cpu = get_cpu();
384
385         __sched_fork(p);
386
387         /*
388          * We mark the process as running here. This guarantees that
389          * nobody will actually run it, and a signal or other external
390          * event cannot wake it up and insert it on the runqueue either.
391          */
392         p->state = TASK_RUNNING;
393
394         /*
395          * Make sure we do not leak PI boosting priority to the child.
396          */
397         p->prio = current->normal_prio;
398
399         raw_spin_lock_irqsave(&p->pi_lock, flags);
400         set_task_cpu(p, cpu);
401         raw_spin_unlock_irqrestore(&p->pi_lock, flags);
402
403 #if defined(CONFIG_SMP)
404         p->on_cpu = 0;
405 #endif
406 #ifdef CONFIG_PREEMPT_COUNT
407         /* Want to start with kernel preemption disabled. */
408         task_thread_info(p)->preempt_count = 1;
409 #endif
410
411         put_cpu();
412 }
413
414 /**
415  * /kernel/sched/core.c:4674
416  * init_idle - set up an idle thread for a given CPU
417  * @idle: task in question
418  * @cpu: cpu the idle task belongs to
419  *
420  * NOTE: this function does not set the idle thread's NEED_RESCHED
421  * flag, to make booting more robust.
422  */
423 void __cpuinit init_idle(struct task_struct *idle, int cpu)
424 {
425         struct rq *rq = cpu_rq(cpu);
426         unsigned long flags;
427
428         raw_spin_lock_irqsave(&rq->lock, flags);
429
430         __sched_fork(idle);
431         idle->state = TASK_RUNNING;
432         idle->se.exec_start = sched_clock();
433
434         do_set_cpus_allowed(idle, cpumask_of(cpu));
435         /*
436          * We're having a chicken and egg problem, even though we are
437          * holding rq->lock, the cpu isn't yet set to this cpu so the
438          * lockdep check in task_group() will fail.
439          *
440          * Similar case to sched_fork(). / Alternatively we could
441          * use task_rq_lock() here and obtain the other rq->lock.
442          *
443          * Silence PROVE_RCU
444          */
445         rcu_read_lock();
446         __set_task_cpu(idle, cpu);
447         rcu_read_unlock();
448
449         rq->curr = rq->idle = idle;
450 #if defined(CONFIG_SMP)
451         idle->on_cpu = 1;
452 #endif
453         raw_spin_unlock_irqrestore(&rq->lock, flags);
454
455         /* Set the preempt count _outside_ the spinlocks! */
456         task_thread_info(idle)->preempt_count = 0;
457
458 #if defined(CONFIG_SMP)
459         sprintf(idle->comm, "%s/%d", INIT_TASK_COMM, cpu);
460 #endif
461 }
462
463 /*
464  * /kernel/sched/cputime.c:436
465  * Account multiple ticks of idle time.
466  * @ticks: number of stolen ticks
467  */
468 void account_idle_ticks(unsigned long ticks)
469 {
470         //printk("\naccount_idle_ticks");
471
472         return;
473 }
474
475 /*
476  * /kernel/sched/cputime.c:397
477  * Account a single tick of cpu time.
478  * @p: the process that the cpu time gets accounted to
479  * @user_tick: indicates if the tick is a user or a system tick
480  */
481 void account_process_tick(struct task_struct *p, int user_tick)
482 {
483         //printk("\naccount_process_tick");
484
485         return;
486 }
487
488 /*
489  * /kernel/sched/core.c:2092
490  * get_avenrun - get the load average array
491  * @loads:    pointer to dest load array
492  * @offset:    offset to add
493  * @shift:    shift count to shift the result left
494  *
495  * These values are estimates at best, so no need for locking.
496  */
497 void get_avenrun(unsigned long *loads, unsigned long offset, int shift)
498 {
499         //printk("\nget_avenrun");
500
501         return;
502 }
503
504 /*
505  * /kernel/sched/core.c:2363
506  * calc_load - update the avenrun load estimates 10 ticks after the
507  * CPUs have updated calc_load_tasks.
508  */
509 void calc_global_load(unsigned long ticks)
510 {
511 //      printk("\ncalc_global_load");
512
513         return;
514 }
515
516 /*
517  * /kernel/sched/core.c:2197
518  * We're going into NOHZ mode, if there's any pending delta, fold it
519  * into the pending idle delta.
520  */
521 /*void calc_load_enter_idle(void)
522 {
523         return;
524 }*/
525
526 /*
527  * /kernel/sched/core.c:2213
528  * If we're still before the sample window, we're done.
529  *
530  * We woke inside or after the sample window, this means we're already
531  * accounted through the nohz accounting, so skip the entire deal and
532  * sync up for the next window.
533  */
534 /*void calc_load_exit_idle(void)
535 {
536         return;
537 }*/
538
539 /*
540  * /kernel/sched/core.c:3668
541  * Check if a task can reduce its nice value
542  * @p: task
543  * @nice: nice value
544  */
545 int can_nice(const struct task_struct *p, const int nice)
546 {
547         //printk("\ncan_nice");
548
549         return 0;
550 }
551
552 /**
553  * kernel/sched/core.c:3768
554  * idle_task - return the idle task for a given cpu.
555  * @cpu: the processor in question.
556  */
557 struct task_struct *idle_task(int cpu)
558 {
559         return cpu_rq(cpu)->idle;
560 }
561
562 /**
563  * /kernel/sched/core.c:3742
564  * idle_cpu - is a given cpu idle currently?
565  * @cpu: the processor in question.
566  */
567 int idle_cpu(int cpu)
568 {
569         struct rq *rq = cpu_rq(cpu);
570
571         if (rq->curr != rq->idle)
572                 return 0;
573
574         if (rq->nr_running)
575                 return 0;
576
577 #ifdef CONFIG_SMP
578         if (!llist_empty(&rq->wake_list))
579                 return 0;
580 #endif
581
582         return 1;
583 }
584
585 /*
586  * /kernel/sched/core.c:4669
587  * Sets sched_class of idle task, see struct sched_class idle_sched_class;
588  */
589 void __cpuinit init_idle_bootup_task(struct task_struct *idle)
590 {
591         //printk("\ninit_idle_bootup_task");
592
593         return;
594 }
595
596 /*
597  * /kernel/sched/core.c:7108
598  * Calls private function
599  * static void normalize_task(struct rq *rq, struct task_struct *p)
600  */
601 void normalize_rt_tasks(void)
602 {
603         printk("\nnormalize_rt_tasks");
604
605         return;
606 }
607
608 /*
609  * /kernel/sched/core.c:1997
610  * nr_running and nr_context_switches:
611  *
612  * externally visible scheduler statistics:
613  *   current number of runnable threads
614  *   total number of context switches performed since bootup.
615  */
616 unsigned long nr_running(void)
617 {
618         printk("\nnr_running");
619
620         // TODO: SMP
621
622         return 0;
623 }
624
625 unsigned long long nr_context_switches(void)
626 {
627 //      printk("\nnr_context_switches");
628
629         int i;
630         unsigned long long sum = 0;
631
632         for_each_possible_cpu(i)
633                 sum += cpu_rq(i)->nr_switches;
634
635         return sum;
636 }
637
638 /*
639  * /kernel/sched/core.c:2008
640  * number of threads waiting on IO
641  */
642 unsigned long nr_iowait(void)
643 {
644         printk("\nnr_iowait");
645
646         // TODO: SMP
647
648         return 0;
649 }
650
651 /*
652  * kernel/sched/core.c:2018
653  */
654 unsigned long nr_iowait_cpu(int cpu)
655 {
656         printk("\nnr_iowait_cpu");
657
658         // TODO: SMP
659
660         return 0;
661 }
662
663 /*
664  * rt_mutex_setprio - set the current priority of a task
665  * @p: task
666  * @prio: prio value (kernel-internal form)
667  *
668  * This function changes the 'effective' priority of a task. It does
669  * not touch ->normal_prio like __setscheduler().
670  *
671  * Used by the rt_mutex code to implement priority inheritance logic.
672  */
673 void rt_mutex_setprio(struct task_struct *p, int prio)
674 {
675         printk("\nrt_mutex_setprio");
676
677         return;
678 }
679
680 /**
681  * sched_clock_cpu - returns current time in nanosec units
682  * using scheduler clock function.
683  * @param: cpu id
684  */
685 //u64 sched_clock_cpu(int cpu)
686 //{
687 //      return 0;
688 //}
689
690 /*
691  * kernel/sched/clock.c:350
692  * Initialize/Start scheduler clock.
693  */
694 //void sched_clock_init(void)
695 //{
696 //      return;
697 //}
698
699 /**
700  * kernel/sched/core.c:4213
701  * This functions stores the CPU affinity mask for the process or thread with the ID pid in the cpusetsize
702  * bytes long bitmap pointed to by cpuset. If successful, the function always initializes all bits in the
703  * cpu_set_t object and returns zero.
704  *
705  * If pid does not correspond to a process or thread on the system the or the function fails for some other
706  * reason, it returns -1 and errno is set to represent the error condition.
707  */
708 long sched_getaffinity(pid_t pid, struct cpumask *mask)
709 {
710         printk("\nsched_getaffinity");
711
712         // TODO: SMP
713
714         return 0;
715 }
716
717 /**
718  * kernel/sched/core.c:7571
719  */
720 int sched_rr_handler(struct ctl_table *table, int write,
721                 void __user *buffer, size_t *lenp,
722                 loff_t *ppos)
723 {
724         //printk("\nsched_rr_handler");
725
726         return 0;
727 }
728
729 /**
730  * kernel/sched/core.c:4111
731  * This function installs the cpusetsize bytes long affinity mask pointed to by cpuset for the process or
732  * thread with the ID pid. If successful the function returns zero and the scheduler will in future take the
733  * affinity information into account.
734  */
735 long sched_setaffinity(pid_t pid, const struct cpumask *new_mask)
736 {
737         //printk("\nsched_setaffinity");
738
739         return 0;
740 }
741
742 /**
743  * kernel/sched/core.c:3975
744  * sched_setscheduler - change the scheduling policy and/or RT priority of a thread.
745  * @p: the task in question.
746  * @policy: new policy.
747  * @param: structure containing the new RT priority.
748  *
749  * NOTE that the task may be already dead.
750  */
751 int sched_setscheduler(struct task_struct *p, int policy,
752                 const struct sched_param *param)
753 {
754         //printk("\nsched_setscheduler");
755
756         return 0;
757 }
758
759 /**
760  * kernel/sched/core.c:3993
761  * sched_setscheduler_nocheck - change the scheduling policy and/or RT priority of a thread from kernelspace.
762  * @p: the task in question.
763  * @policy: new policy.
764  * @param: structure containing the new RT priority.
765  *
766  * Just like sched_setscheduler, only don't bother checking if the
767  * current context has permission.  For example, this is needed in
768  * stop_machine(): we create temporary high priority worker threads,
769  * but our caller might not have that capability.
770  */
771 int sched_setscheduler_nocheck(struct task_struct *p, int policy,
772 const struct sched_param *param)
773 {
774 //      //printk("\nsched_setscheduler_nocheck");
775
776         return 0;
777 }
778
779 /**
780  * kernel/sched/core.c:4601
781  */
782 void sched_show_task(struct task_struct *p)
783 {
784         //printk("\nsched_show_task");
785
786         return;
787 }
788
789 /**
790  * kernel/sched/core.c:652
791  */
792 void resched_task(struct task_struct *p)
793 {
794         int cpu;
795
796         assert_raw_spin_locked(&task_rq(p)->lock);
797
798         if (test_tsk_need_resched(p))
799                 return;
800
801         set_tsk_need_resched(p);
802
803         cpu = task_cpu(p);
804         if (cpu == smp_processor_id())
805                 return;
806
807         /* NEED_RESCHED must be visible before we test polling */
808         smp_mb();
809         if (!tsk_is_polling(p))
810                 smp_send_reschedule(cpu);
811
812 //      printk(">>resched_task %d\n",p->pid);
813 }
814
815 /**
816  * kernel/sched/core.c:1806
817  * prepare_task_switch - prepare to switch tasks
818  * @rq: the runqueue preparing to switch
819  * @prev: the current task that is being switched out
820  * @next: the task we are going to switch to.
821  *
822  * This is called with the rq lock held and interrupts off. It must
823  * be paired with a subsequent finish_task_switch after the context
824  * switch.
825  *
826  * prepare_task_switch sets up locking and calls architecture specific
827  * hooks.
828  */
829 static inline void
830 prepare_task_switch(struct rq *rq, struct task_struct *prev,
831                     struct task_struct *next)
832 {
833 //      trace_sched_switch(prev, next);
834 //      sched_info_switch(prev, next);
835 //      perf_event_task_sched_out(prev, next);
836 //      fire_sched_out_preempt_notifiers(prev, next);
837         prepare_lock_switch(rq, next);
838 //      prepare_arch_switch(next);
839 }
840
841 /**
842  * kernel/sched/core.c:1826
843  * finish_task_switch - clean up after a task-switch
844  * @rq: runqueue associated with task-switch
845  * @prev: the thread we just switched away from.
846  *
847  * finish_task_switch must be called after the context switch, paired
848  * with a prepare_task_switch call before the context switch.
849  * finish_task_switch will reconcile locking set up by prepare_task_switch,
850  * and do any other architecture-specific cleanup actions.
851  *
852  * Note that we may have delayed dropping an mm in context_switch(). If
853  * so, we finish that here outside of the runqueue lock. (Doing it
854  * with the lock held can cause deadlocks; see schedule() for
855  * details.)
856  */
857 static void finish_task_switch(struct rq *rq, struct task_struct *prev)
858         __releases(rq->lock)
859 {
860         struct mm_struct *mm = rq->prev_mm;
861         long prev_state;
862
863         rq->prev_mm = NULL;
864
865         /*
866          * A task struct has one reference for the use as "current".
867          * If a task dies, then it sets TASK_DEAD in tsk->state and calls
868          * schedule one last time. The schedule call will never return, and
869          * the scheduled task must drop that reference.
870          * The test for TASK_DEAD must occur while the runqueue locks are
871          * still held, otherwise prev could be scheduled on another cpu, die
872          * there before we look at prev->state, and then the reference would
873          * be dropped twice.
874          *              Manfred Spraul <manfred@colorfullife.com>
875          */
876         prev_state = prev->state;
877         vtime_task_switch(prev);
878 //      finish_arch_switch(prev);
879 //      perf_event_task_sched_in(prev, current);
880         finish_lock_switch(rq, prev);
881         finish_arch_post_lock_switch();
882
883 //      fire_sched_in_preempt_notifiers(current);
884         if (mm)
885                 mmdrop(mm);
886         if (unlikely(prev_state == TASK_DEAD)) {
887                 /*
888                  * Remove function-return probe instances associated with this
889                  * task and put them back on the free list.
890                  */
891                 kprobe_flush_task(prev);
892                 put_task_struct(prev);
893         }
894 }
895
896 #ifdef CONFIG_SMP
897
898 /* assumes rq->lock is held */
899 static inline void pre_schedule(struct rq *rq, struct task_struct *prev)
900 {
901 }
902
903 /* rq->lock is NOT held, but preemption is disabled */
904 static inline void post_schedule(struct rq *rq)
905 {
906 }
907
908 #else
909
910 static inline void pre_schedule(struct rq *rq, struct task_struct *p)
911 {
912 }
913
914 static inline void post_schedule(struct rq *rq)
915 {
916 }
917
918 #endif
919
920 /**
921  * kernel/sched/core.c:1905
922  * schedule_tail - first thing a freshly forked thread must call.
923  * @prev: the thread we just switched away from.
924  */
925 asmlinkage void schedule_tail(struct task_struct *prev)
926         __releases(rq->lock)
927 {
928 //      printk(">>schedule_tail %d\n",prev->pid);
929         struct rq *rq = this_rq();
930
931         finish_task_switch(rq, prev);
932
933         /*
934          * FIXME: do we need to worry about rq being invalidated by the
935          * task_switch?
936          */
937         // TODO: SMP
938         post_schedule(rq);
939
940         // TODO: replace this irq enable, maybe inside post_schedule
941         arch_local_irq_enable();
942
943 #ifdef __ARCH_WANT_UNLOCKED_CTXSW
944         /* In this case, finish_task_switch does not reenable preemption */
945         preempt_enable();
946 #endif
947         if (current->set_child_tid)
948                 put_user(task_pid_vnr(current), current->set_child_tid);
949 }
950
951
952 /**
953  * kernel/sched/core.c:769
954  */
955 static void update_rq_clock_task(struct rq *rq, s64 delta)
956 {
957 /*
958  * In theory, the compile should just see 0 here, and optimize out the call
959  * to sched_rt_avg_update. But I don't trust it...
960  */
961 #if defined(CONFIG_IRQ_TIME_ACCOUNTING) || defined(CONFIG_PARAVIRT_TIME_ACCOUNTING)
962         s64 steal = 0, irq_delta = 0;
963 #endif
964 #ifdef CONFIG_IRQ_TIME_ACCOUNTING
965         irq_delta = irq_time_read(cpu_of(rq)) - rq->prev_irq_time;
966
967         /*
968          * Since irq_time is only updated on {soft,}irq_exit, we might run into
969          * this case when a previous update_rq_clock() happened inside a
970          * {soft,}irq region.
971          *
972          * When this happens, we stop ->clock_task and only update the
973          * prev_irq_time stamp to account for the part that fit, so that a next
974          * update will consume the rest. This ensures ->clock_task is
975          * monotonic.
976          *
977          * It does however cause some slight miss-attribution of {soft,}irq
978          * time, a more accurate solution would be to update the irq_time using
979          * the current rq->clock timestamp, except that would require using
980          * atomic ops.
981          */
982         if (irq_delta > delta)
983                 irq_delta = delta;
984
985         rq->prev_irq_time += irq_delta;
986         delta -= irq_delta;
987 #endif
988 #ifdef CONFIG_PARAVIRT_TIME_ACCOUNTING
989         if (static_key_false((&paravirt_steal_rq_enabled))) {
990                 u64 st;
991
992                 steal = paravirt_steal_clock(cpu_of(rq));
993                 steal -= rq->prev_steal_time_rq;
994
995                 if (unlikely(steal > delta))
996                         steal = delta;
997
998                 st = steal_ticks(steal);
999                 steal = st * TICK_NSEC;
1000
1001                 rq->prev_steal_time_rq += steal;
1002
1003                 delta -= steal;
1004         }
1005 #endif
1006
1007         rq->clock_task += delta;
1008
1009 #if defined(CONFIG_IRQ_TIME_ACCOUNTING) || defined(CONFIG_PARAVIRT_TIME_ACCOUNTING)
1010         if ((irq_delta + steal) && sched_feat(NONTASK_POWER))
1011                 sched_rt_avg_update(rq, irq_delta + steal);
1012 #endif
1013 }
1014
1015 //static void update_rq_clock_task(struct rq *rq, s64 delta);
1016 void update_rq_clock(struct rq *rq)
1017 {
1018         s64 delta;
1019
1020         if (rq->skip_clock_update > 0)
1021                 return;
1022
1023         delta = sched_clock_cpu(cpu_of(rq)) - rq->clock;
1024         rq->clock += delta;
1025         update_rq_clock_task(rq, delta);
1026 }
1027
1028 /*
1029  * kernel/sched/core.c:2684
1030  * This function gets called by the timer code, with HZ frequency.
1031  * We call it with interrupts disabled.
1032  */
1033 void scheduler_tick(void)
1034 {
1035         int cpu = smp_processor_id();
1036         struct rq *rq = cpu_rq(cpu);
1037         struct task_struct *curr = rq->curr;
1038
1039         u64 now = rq->clock_task;
1040         unsigned long delta_exec;
1041
1042         sched_clock_tick();
1043
1044         raw_spin_lock(&rq->lock);
1045         update_rq_clock(rq);
1046
1047         /*
1048          * Update run-time statistics of the 'current'.
1049          */
1050         if (unlikely(!curr)) {
1051                 raw_spin_unlock(&rq->lock);
1052                 return;
1053         }
1054
1055         /*
1056          * Get the amount of time the current task was running
1057          * since the last time we changed load (this cannot
1058          * overflow on 32 bits):
1059          */
1060         delta_exec = (unsigned long)(now - curr->se.exec_start);
1061
1062         if (delta_exec > RR_TIMESLICE) {
1063                 resched_task(curr);
1064         }
1065
1066         raw_spin_unlock(&rq->lock);
1067
1068         // TODO: SMP for load balancing
1069 }
1070
1071 /*
1072  * kernel/sched/core.c:2649
1073  * Lock/unlock the current runqueue - to extract task statistics:
1074  */
1075 unsigned long long task_delta_exec(struct task_struct *p)
1076 {
1077         printk("\ntask_delta_exec");
1078
1079         // TODO: SMP
1080
1081         return 0;
1082 }
1083
1084 /**
1085  * kernel/sched/core.c:3727
1086  * task_prio - return the priority value of a given task.
1087  * @p: the task in question.
1088  *
1089  * This is the priority value as seen by users in /proc.
1090  * RT tasks are offset by -200. Normal tasks are centered
1091  * around 0, value goes from -16 to +15.
1092  */
1093 int task_prio(const struct task_struct *p)
1094 {
1095         //printk("\ntask_prio");
1096
1097         return 0;
1098 }
1099
1100 /*
1101  * kernel/sched/core.c:2667
1102  * Return accounted runtime for the task.
1103  * In case the task is currently running, return the runtime plus current's
1104  * pending runtime that have not been accounted yet.
1105  */
1106 unsigned long long task_sched_runtime(struct task_struct *task)
1107 {
1108         //printk("\ntask_sched_runtime");
1109
1110         return 0;
1111 }
1112
1113 /*
1114  * kernel/sched/core.c:2024
1115  * this_cpu_load - returns load of the cpu
1116  */
1117 unsigned long this_cpu_load(void)
1118 {
1119         //printk("\nthis_cpu_load");
1120
1121         // TODO: SMP, needed in case of load balancing per CPU
1122
1123         return 0;
1124 }
1125
1126 /*
1127  * kernel/sched/core.c:2556
1128  * update_cpu_load_nohz - called from tick_nohz_idle_exit() -- try and fix up the ticks we missed.
1129  */
1130 void update_cpu_load_nohz(void)
1131 {
1132         printk("\nupdate_cpu_load_nohz");
1133
1134         return;
1135 }
1136
1137
1138 /*
1139  * kernel/sched/core.c:1207
1140  * The caller (fork, wakeup) owns p->pi_lock, ->cpus_allowed is stable.
1141  */
1142 static inline
1143 int select_task_rq(struct task_struct *p, int sd_flags, int wake_flags)
1144 {
1145 //      printk(">>select_task_rq");
1146         int cpu = task_cpu(p);
1147 //      int cpu = p->sched_class->select_task_rq(p, sd_flags, wake_flags);
1148
1149         /*
1150          * In order not to call set_task_cpu() on a blocking task we need
1151          * to rely on ttwu() to place the task on a valid ->cpus_allowed
1152          * cpu.
1153          *
1154          * Since this is common to all placement strategies, this lives here.
1155          *
1156          * [ this allows ->select_task() to simply return task_cpu(p) and
1157          *   not worry about this generic constraint ]
1158          */
1159         if (unlikely(!cpumask_test_cpu(cpu, tsk_cpus_allowed(p)) ||
1160                      !cpu_online(cpu)))
1161                 cpu = cpumask_first(tsk_cpus_allowed(p)); //select_fallback_rq(task_cpu(p), p);
1162
1163         return cpu;
1164 }
1165
1166 /*
1167  * kernel/sched/core.c:736
1168  */
1169 void activate_task(struct rq *rq, struct task_struct *p, int flags)
1170 {
1171 //      printk(">>activate_task %d\n",p->pid);
1172         if (task_contributes_to_load(p))
1173                 rq->nr_uninterruptible--;
1174
1175 //      enqueue_task(rq, p, flags);
1176 //      list_add(&p->rq_tasks, &rq->rq_list);
1177
1178 //TODO: FRAMEWORK STUFF OR not?
1179 //      send_to_topic(0,p);
1180 }
1181
1182 /*
1183  * kernel/sched/core.c:744
1184  */
1185 void deactivate_task(struct rq *rq, struct task_struct *p, int flags)
1186 {
1187         printk(">>deactivate_task\n");
1188         if (task_contributes_to_load(p))
1189                 rq->nr_uninterruptible++;
1190
1191 //      dequeue_task(rq, p, flags);
1192 //      list_del(&p->rq_tasks);
1193 }
1194
1195 /*
1196  * kernel/sched/core.c:1275
1197  */
1198 static void ttwu_activate(struct rq *rq, struct task_struct *p, int en_flags)
1199 {
1200 //      printk(">>ttwu_activate %d\n",p->pid);
1201         activate_task(rq, p, en_flags);
1202         p->on_rq = 1;
1203
1204         /* if a worker is waking up, notify workqueue */
1205         if (p->flags & PF_WQ_WORKER)
1206         {
1207                 //TODO: remove the print and klammerns later
1208 //              printk(">>EFFING worker here\n");
1209                 wq_worker_waking_up(p, cpu_of(rq));
1210         }
1211 }
1212
1213 /*
1214  * kernel/sched/core.c:909
1215  */
1216 void check_preempt_curr(struct rq *rq, struct task_struct *p, int flags)
1217 {
1218 //      const struct sched_class *class;
1219 //
1220 //      if (p->sched_class == rq->curr->sched_class) {
1221 //              rq->curr->sched_class->check_preempt_curr(rq, p, flags);
1222 //      } else {
1223 //              for_each_class(class) {
1224 //                      if (class == rq->curr->sched_class)
1225 //                              break;
1226 //                      if (class == p->sched_class) {
1227 //                              resched_task(rq->curr);
1228 //                              break;
1229 //                      }
1230 //              }
1231 //      }
1232         if (rq->curr == rq->idle)
1233                         resched_task(rq->curr);
1234
1235         /*
1236          * A queue event has occurred, and we're going to schedule.  In
1237          * this case, we can save a useless back to back clock update.
1238          */
1239         if (rq->curr->on_rq && test_tsk_need_resched(rq->curr))
1240                 rq->skip_clock_update = 1;
1241 }
1242
1243 /*
1244  * kernel/sched/core:1289
1245  * Mark the task runnable and perform wakeup-preemption.
1246  */
1247 static void
1248 ttwu_do_wakeup(struct rq *rq, struct task_struct *p, int wake_flags)
1249 {
1250 //      printk(">>ttwu_do_wakeup task %d\n",p->pid);
1251 //      trace_sched_wakeup(p, true);
1252         check_preempt_curr(rq, p, wake_flags);
1253
1254         p->state = TASK_RUNNING;
1255 //#ifdef CONFIG_SMP
1256 //      if (p->sched_class->task_woken)
1257 //              p->sched_class->task_woken(rq, p);
1258 //
1259 //      if (rq->idle_stamp) {
1260 //              u64 delta = rq->clock - rq->idle_stamp;
1261 //              u64 max = 2*sysctl_sched_migration_cost;
1262 //
1263 //              if (delta > max)
1264 //                      rq->avg_idle = max;
1265 //              else
1266 //                      update_avg(&rq->avg_idle, delta);
1267 //              rq->idle_stamp = 0;
1268 //      }
1269 //#endif
1270 }
1271
1272 /*
1273  * kernel/sched/core.c:1313
1274  */
1275 static void
1276 ttwu_do_activate(struct rq *rq, struct task_struct *p, int wake_flags)
1277 {
1278 //      printk(">>ttwu_do_activate\n");
1279 #ifdef CONFIG_SMP
1280         if (p->sched_contributes_to_load)
1281                 rq->nr_uninterruptible--;
1282 #endif
1283
1284         ttwu_activate(rq, p, ENQUEUE_WAKEUP | ENQUEUE_WAKING);
1285         ttwu_do_wakeup(rq, p, wake_flags);
1286 }
1287
1288 /*
1289  * kernel/sched/core.c:1394
1290  */
1291 static void ttwu_queue_remote(struct task_struct *p, int cpu)
1292 {
1293 //      printk(">>ttwu_queue_remote\n");
1294 #if defined(CONFIG_SMP)
1295         if (llist_add(&p->wake_entry, &cpu_rq(cpu)->wake_list))
1296                 smp_send_reschedule(cpu);
1297 #endif
1298 }
1299
1300 /*
1301  * kernel/sched/core.c:1406
1302  */
1303 static void ttwu_queue(struct task_struct *p, int cpu)
1304 {
1305         struct rq *rq = cpu_rq(cpu);
1306 //      printk(">>ttwu_queue task %d : cpu %d\n",p->pid, cpu);
1307
1308 #if defined(CONFIG_SMP)
1309         if (/*sched_feat(TTWU_QUEUE) && */!cpus_share_cache(smp_processor_id(), cpu)) {
1310                 sched_clock_cpu(cpu); /* sync clocks x-cpu */
1311                 ttwu_queue_remote(p, cpu);
1312                 return;
1313         }
1314 #endif
1315
1316         raw_spin_lock(&rq->lock);
1317         ttwu_do_activate(rq, p, 0);
1318         raw_spin_unlock(&rq->lock);
1319 }
1320
1321 /*
1322  * kernel/sched/core.c:1703
1323  * wake_up_new_task - wake up a newly created task for the first time.
1324  *
1325  * This function will do some initial scheduler statistics housekeeping
1326  * that must be done for every newly created context, then puts the task
1327  * on the runqueue and wakes it.
1328  */
1329 void wake_up_new_task(struct task_struct *p)
1330 {
1331         unsigned long flags;
1332         struct rq *rq;
1333 //      int cpu = 255;
1334
1335 //      TODO: FRAMEWORK ZEUGS
1336         send_to_topic(1,p);
1337
1338         raw_spin_lock_irqsave(&p->pi_lock, flags);
1339
1340 #ifdef CONFIG_SMP
1341         /*
1342          * Fork balancing, do it here and not earlier because:
1343          *  - cpus_allowed can change in the fork path
1344          *  - any previously selected cpu might disappear through hotplug
1345          */
1346         set_task_cpu(p, select_task_rq(p, SD_BALANCE_FORK, 0));
1347 //      printk("new thread\n");
1348 //      for_each_cpu(cpu, &(p->cpus_allowed)){
1349 //              printk("Asked for CPU #%d\n", cpu);
1350 //      }
1351
1352 #endif
1353
1354
1355         rq = __task_rq_lock(p);
1356 //      send_to_topic(1,p);
1357 //      printk(">>wake_up_new_task:");
1358         activate_task(rq, p, 0);
1359         p->on_rq = 1;
1360 //      trace_sched_wakeup_new(p, true);
1361         check_preempt_curr(rq, p, WF_FORK);
1362 //#ifdef CONFIG_SMP
1363 //      if (p->sched_class->task_woken)
1364 //              p->sched_class->task_woken(rq, p);
1365 //#endif
1366         task_rq_unlock(rq, p, &flags);
1367
1368         //TODO: FRAMEWORK ZEUGS
1369 //      send_to_topic(1,p);
1370
1371 //      printk(">>wake_up_new_task:");
1372 //      activate_task(rq, p, 0);
1373
1374 }
1375
1376 /*
1377  * kernel/sched/core:1330
1378  * Called in case the task @p isn't fully descheduled from its runqueue,
1379  * in this case we must do a remote wakeup. Its a 'light' wakeup though,
1380  * since all we need to do is flip p->state to TASK_RUNNING, since
1381  * the task is still ->on_rq.
1382  */
1383 static int ttwu_remote(struct task_struct *p, int wake_flags)
1384 {
1385 //      printk(">>ttwu_remote %d\n",p->pid);
1386         struct rq *rq;
1387         int ret = 0;
1388
1389         rq = __task_rq_lock(p);
1390         if (p->on_rq) {
1391                 ttwu_do_wakeup(rq, p, wake_flags);
1392                 ret = 1;
1393         }
1394         __task_rq_unlock(rq);
1395
1396         return ret;
1397 }
1398
1399 /**
1400  * kernel/sched/core.c:1439
1401  * try_to_wake_up - wake up a thread
1402  * @p: the thread to be awakened
1403  * @state: the mask of task states that can be woken
1404  * @wake_flags: wake modifier flags (WF_*)
1405  *
1406  * Put it on the run-queue if it's not already there. The "current"
1407  * thread is always on the run-queue (except when the actual
1408  * re-schedule is in progress), and as such you're allowed to do
1409  * the simpler "current->state = TASK_RUNNING" to mark yourself
1410  * runnable without the overhead of this.
1411  *
1412  * Returns %true if @p was woken up, %false if it was already running
1413  * or @state didn't match @p's state.
1414  */
1415 static int
1416 try_to_wake_up(struct task_struct *p, unsigned int state, int wake_flags)
1417 {
1418 //      printk(">>try_to_wake_up %d\n",p->pid);
1419
1420         unsigned long flags;
1421         int cpu, success = 0;
1422
1423         smp_wmb();
1424         raw_spin_lock_irqsave(&p->pi_lock, flags);
1425         if (!(p->state & state))
1426                 goto out;
1427
1428         success = 1; /* we're going to change ->state */
1429         cpu = task_cpu(p);
1430
1431         if (p->on_rq && ttwu_remote(p, wake_flags))
1432                 goto stat;
1433
1434 //      TODO:framework zeugs
1435         send_to_topic(0,p);
1436
1437 #ifdef CONFIG_SMP
1438         /*
1439          * If the owning (remote) cpu is still in the middle of schedule() with
1440          * this task as prev, wait until its done referencing the task.
1441          */
1442         while (p->on_cpu)
1443                 cpu_relax();
1444         /*
1445          * Pairs with the smp_wmb() in finish_lock_switch().
1446          */
1447         smp_rmb();
1448
1449 //      p->sched_contributes_to_load = !!task_contributes_to_load(p);
1450         p->state = TASK_WAKING;
1451
1452 //      if (p->sched_class->task_waking)
1453 //              p->sched_class->task_waking(p);
1454
1455         // TODO: simply not using select_task_rq :)
1456         cpu = select_task_rq(p, SD_BALANCE_WAKE, wake_flags);
1457         if (task_cpu(p) != cpu) {
1458                 wake_flags |= WF_MIGRATED;
1459                 set_task_cpu(p, cpu);
1460         }
1461 #endif /* CONFIG_SMP */
1462
1463
1464
1465         ttwu_queue(p, cpu);
1466 stat:
1467 //      raw_spin_unlock(&rq->lock);
1468 out:
1469         raw_spin_unlock_irqrestore(&p->pi_lock, flags);
1470
1471 //TODO: FRAMEWORK
1472 //send_to_topic(0,p);
1473
1474         return success;
1475 }
1476
1477 /**
1478  * kernel/sched/core.c:1497
1479  * try_to_wake_up_local - try to wake up a local task with rq lock held
1480  * @p: the thread to be awakened
1481  *
1482  * Put @p on the run-queue if it's not already there. The caller must
1483  * ensure that this_rq() is locked, @p is bound to this_rq() and not
1484  * the current task.
1485  */
1486 static void try_to_wake_up_local(struct task_struct *p)
1487 {
1488 //      printk(">>try_to_wake_up_local %d\n",p->pid);
1489         struct rq *rq = task_rq(p);
1490
1491         if (WARN_ON_ONCE(rq != this_rq()) ||
1492             WARN_ON_ONCE(p == current))
1493                 return;
1494
1495         lockdep_assert_held(&rq->lock);
1496
1497         if (!raw_spin_trylock(&p->pi_lock)) {
1498                 raw_spin_unlock(&rq->lock);
1499                 raw_spin_lock(&p->pi_lock);
1500                 raw_spin_lock(&rq->lock);
1501         }
1502
1503         if (!(p->state & TASK_NORMAL))
1504                 goto out;
1505
1506         if (!p->on_rq)
1507                 ttwu_activate(rq, p, ENQUEUE_WAKEUP);
1508
1509         ttwu_do_wakeup(rq, p, 0);
1510 //      ttwu_stat(p, smp_processor_id(), 0);
1511 out:
1512         raw_spin_unlock(&p->pi_lock);
1513 }
1514
1515 /*
1516  * kernel/sched/core.c:1931
1517  * context_switch - switch to the new MM and the new
1518  * thread's register state.
1519  */
1520 //static inline void
1521 void
1522 context_switch(struct rq *rq, struct task_struct *prev,
1523                struct task_struct *next)
1524 {
1525 //      printk(">>context_switch\n");
1526         struct mm_struct *mm, *oldmm;
1527
1528         prepare_task_switch(rq, prev, next);
1529
1530         mm = next->mm;
1531         oldmm = prev->active_mm;
1532         /*
1533          * For paravirt, this is coupled with an exit in switch_to to
1534          * combine the page table reload and the switch backend into
1535          * one hypercall.
1536          */
1537 //      arch_start_context_switch(prev);
1538
1539         if (!mm) {
1540                 next->active_mm = oldmm;
1541                 atomic_inc(&oldmm->mm_count);
1542                 enter_lazy_tlb(oldmm, next);
1543         }
1544         else
1545                 switch_mm(oldmm, mm, next);
1546
1547         if (!prev->mm) {
1548                 prev->active_mm = NULL;
1549                 rq->prev_mm = oldmm;
1550         }
1551         /*
1552          * Since the runqueue lock will be released by the next
1553          * task (which is an invalid locking op but in the case
1554          * of the scheduler it's an obvious special-case), so we
1555          * do an early lockdep release here:
1556          */
1557 #ifndef __ARCH_WANT_UNLOCKED_CTXSW
1558         spin_release(&rq->lock.dep_map, 1, _THIS_IP_);
1559 #endif
1560
1561         context_tracking_task_switch(prev, next);
1562         /* Here we just switch the register state and the stack. */
1563         switch_to(prev, next, prev);
1564
1565         barrier();
1566         /*
1567          * this_rq must be evaluated again because prev may have moved
1568          * CPUs since it called schedule(), thus the 'rq' on its stack
1569          * frame will be invalid.
1570          */
1571         finish_task_switch(this_rq(), prev);
1572
1573 }
1574
1575 /*
1576  * kernel/sched/core.c:2875
1577  * __schedule() is the main scheduler function.
1578  *
1579  * The main means of driving the scheduler and thus entering this function are:
1580  *
1581  *   1. Explicit blocking: mutex, semaphore, waitqueue, etc.
1582  *
1583  *   2. TIF_NEED_RESCHED flag is checked on interrupt and userspace return
1584  *      paths. For example, see arch/x86/entry_64.S.
1585  *
1586  *      To drive preemption between tasks, the scheduler sets the flag in timer
1587  *      interrupt handler scheduler_tick().
1588  *
1589  *   3. Wakeups don't really cause entry into schedule(). They add a
1590  *      task to the run-queue and that's it.
1591  *
1592  *      Now, if the new task added to the run-queue preempts the current
1593  *      task, then the wakeup sets TIF_NEED_RESCHED and schedule() gets
1594  *      called on the nearest possible occasion:
1595  *
1596  *       - If the kernel is preemptible (CONFIG_PREEMPT=y):
1597  *
1598  *         - in syscall or exception context, at the next outmost
1599  *           preempt_enable(). (this might be as soon as the wake_up()'s
1600  *           spin_unlock()!)
1601  *
1602  *         - in IRQ context, return from interrupt-handler to
1603  *           preemptible context
1604  *
1605  *       - If the kernel is not preemptible (CONFIG_PREEMPT is not set)
1606  *         then at the next:
1607  *
1608  *          - cond_resched() call
1609  *          - explicit schedule() call
1610  *          - return from syscall or exception to user-space
1611  *          - return from interrupt-handler to user-space
1612  */
1613 static void __sched __schedule(void)
1614 {
1615         struct task_struct *prev;
1616         struct rq *rq;
1617         int cpu;
1618
1619 need_resched:
1620         preempt_disable();//Important, calls __barrier
1621         cpu = smp_processor_id();
1622         rq = cpu_rq(cpu);
1623         prev = rq->curr;
1624
1625         raw_spin_lock_irq(&rq->lock);
1626
1627         if (prev->state && !(preempt_count() & PREEMPT_ACTIVE)) {
1628                 if (unlikely(signal_pending_state(prev->state, prev))) {
1629                         prev->state = TASK_RUNNING;
1630                 } else {
1631                         prev->on_rq = 0;
1632
1633                         /*
1634                          * If a worker went to sleep, notify and ask workqueue
1635                          * whether it wants to wake up a task to maintain
1636                          * concurrency.
1637                          */
1638                         if (prev->flags & PF_WQ_WORKER) {
1639                                 struct task_struct *to_wakeup;
1640
1641                                 to_wakeup = wq_worker_sleeping(prev, cpu);
1642                                 if (to_wakeup)
1643                                         try_to_wake_up_local(to_wakeup);
1644                         }
1645                 }
1646         }
1647
1648         if(prev->state & TASK_DEAD){
1649                 send_to_topic(2,prev);
1650         }else if(prev->state && !(preempt_count() & PREEMPT_ACTIVE)){
1651                 //yield
1652                 send_to_topic(4,prev);
1653         }else{
1654                 //tick
1655                 send_to_topic(3,NULL);
1656         }
1657
1658         sched_preempt_enable_no_resched();
1659         if (need_resched())
1660                 goto need_resched;
1661 }
1662
1663 /*
1664  * kernel/sched/core.c:2966
1665  */
1666 asmlinkage void __sched schedule(void)
1667 {
1668 //      struct task_struct *tsk = current;
1669 //
1670 //      if (!tsk->state || tsk_is_pi_blocked(tsk))
1671 //              return;
1672
1673         __schedule();
1674 }
1675 EXPORT_SYMBOL(schedule);
1676
1677 /*
1678  * kernel/sched/core.c:3125
1679  * The core wakeup function. Non-exclusive wakeups (nr_exclusive == 0) just
1680  * wake everything up. If it's an exclusive wakeup (nr_exclusive == small +ve
1681  * number) then we wake all the non-exclusive tasks and one exclusive task.
1682  *
1683  * There are circumstances in which we can try to wake a task which has already
1684  * started to run but is not in state TASK_RUNNING. try_to_wake_up() returns
1685  * zero in this (rare) case, and we handle it by continuing to scan the queue.
1686  */
1687 static void __wake_up_common(wait_queue_head_t *q, unsigned int mode,
1688                         int nr_exclusive, int wake_flags, void *key)
1689 {
1690 //      printk(">>__wake_up_common\n");
1691         wait_queue_t *curr, *next;
1692
1693         list_for_each_entry_safe(curr, next, &q->task_list, task_list) {
1694                 unsigned flags = curr->flags;
1695
1696                 if (curr->func(curr, mode, wake_flags, key) &&
1697                                 (flags & WQ_FLAG_EXCLUSIVE) && !--nr_exclusive)
1698                         break;
1699         }
1700 }
1701
1702 /**
1703  * kernel/sched/core.c:3149
1704  * __wake_up - wake up threads blocked on a waitqueue.
1705  * @q: the waitqueue
1706  * @mode: which threads
1707  * @nr_exclusive: how many wake-one or wake-many threads to wake up
1708  * @key: is directly passed to the wakeup function
1709  *
1710  * It may be assumed that this function implies a write memory barrier before
1711  * changing the task state if and only if any tasks are woken up.
1712  */
1713 void __wake_up(wait_queue_head_t *q, unsigned int mode,
1714                         int nr_exclusive, void *key)
1715 {
1716         unsigned long flags;
1717
1718         spin_lock_irqsave(&q->lock, flags);
1719         __wake_up_common(q, mode, nr_exclusive, 0, key);
1720         spin_unlock_irqrestore(&q->lock, flags);
1721 }
1722 EXPORT_SYMBOL(__wake_up);
1723
1724 /**
1725  * kernel/sched/core.c:1536
1726  * wake_up_process - Wake up a specific process
1727  * @p: The process to be woken up.
1728  *
1729  * Attempt to wake up the nominated process and move it to the set of runnable
1730  * processes.  Returns 1 if the process was woken up, 0 if it was already
1731  * running.
1732  *
1733  * It may be assumed that this function implies a write memory barrier before
1734  * changing the task state if and only if any tasks are woken up.
1735  */
1736 int wake_up_process(struct task_struct *p)
1737 {
1738 //      printk(">>wake_up_process %d\n",p->pid);
1739         WARN_ON(task_is_stopped_or_traced(p));
1740         return try_to_wake_up(p, TASK_NORMAL, 0);
1741 }
1742 EXPORT_SYMBOL(wake_up_process);
1743
1744 static inline long __sched
1745 do_wait_for_common(struct completion *x,
1746                    long (*action)(long), long timeout, int state)
1747 {
1748         if (!x->done) {
1749                 DECLARE_WAITQUEUE(wait, current);
1750
1751                 __add_wait_queue_tail_exclusive(&x->wait, &wait);
1752                 do {
1753                         if (signal_pending_state(state, current)) {
1754                                 timeout = -ERESTARTSYS;
1755                                 break;
1756                         }
1757                         __set_current_state(state);
1758                         spin_unlock_irq(&x->wait.lock);
1759                         timeout = action(timeout);
1760                         spin_lock_irq(&x->wait.lock);
1761                 } while (!x->done && timeout);
1762                 __remove_wait_queue(&x->wait, &wait);
1763                 if (!x->done)
1764                         return timeout;
1765         }
1766         x->done--;
1767         return timeout ?: 1;
1768 }
1769
1770 static inline long __sched
1771 __wait_for_common(struct completion *x,
1772                   long (*action)(long), long timeout, int state)
1773 {
1774         might_sleep();
1775
1776         spin_lock_irq(&x->wait.lock);
1777         timeout = do_wait_for_common(x, action, timeout, state);
1778         spin_unlock_irq(&x->wait.lock);
1779         return timeout;
1780 }
1781
1782 static long __sched
1783 wait_for_common(struct completion *x, long timeout, int state)
1784 {
1785         return __wait_for_common(x, schedule_timeout, timeout, state);
1786 }
1787
1788 /**
1789  * kernel/sched/core.c:3322
1790  * wait_for_completion: - waits for completion of a task
1791  * @x:  holds the state of this particular completion
1792  *
1793  * This waits to be signaled for completion of a specific task. It is NOT
1794  * interruptible and there is no timeout.
1795  *
1796  * See also similar routines (i.e. wait_for_completion_timeout()) with timeout
1797  * and interrupt capability. Also see complete().
1798  */
1799 void __sched wait_for_completion(struct completion *x)
1800 {
1801         wait_for_common(x, MAX_SCHEDULE_TIMEOUT, TASK_UNINTERRUPTIBLE);
1802 }
1803 EXPORT_SYMBOL(wait_for_completion);
1804
1805 /**
1806  * kernel/sched/core.c:3231
1807  * complete: - signals a single thread waiting on this completion
1808  * @x:  holds the state of this particular completion
1809  *
1810  * This will wake up a single thread waiting on this completion. Threads will be
1811  * awakened in the same order in which they were queued.
1812  *
1813  * See also complete_all(), wait_for_completion() and related routines.
1814  *
1815  * It may be assumed that this function implies a write memory barrier before
1816  * changing the task state if and only if any tasks are woken up.
1817  */
1818 void complete(struct completion *x)
1819 {
1820 //      printk(">>complete\n");
1821         unsigned long flags;
1822
1823         spin_lock_irqsave(&x->wait.lock, flags);
1824         x->done++;
1825         __wake_up_common(&x->wait, TASK_NORMAL, 1, 0, NULL);
1826         spin_unlock_irqrestore(&x->wait.lock, flags);
1827 }
1828 EXPORT_SYMBOL(complete);
1829
1830 /**
1831  * kernel/sched/core.c:2995
1832  * schedule_preempt_disabled - called with preemption disabled
1833  *
1834  * Returns with preemption disabled. Note: preempt_count must be 1
1835  */
1836 void __sched schedule_preempt_disabled(void)
1837 {
1838         sched_preempt_enable_no_resched();
1839         schedule();
1840         preempt_disable();
1841 }
1842
1843 /*
1844  * kernel/sched/core.c:6858
1845  */
1846 int in_sched_functions(unsigned long addr)
1847 {
1848         printk("\nin_sched_functions");
1849
1850         return 0;
1851 }
1852
1853 /*
1854  * kernel/sched/core.c:4333
1855  * __cond_resched_lock() - if a reschedule is pending, drop the given lock,
1856  * call schedule, and on return reacquire the lock.
1857  *
1858  * This works OK both with and without CONFIG_PREEMPT. We do strange low-level
1859  * operations here to prevent schedule() from being called twice (once via
1860  * spin_unlock(), once by hand).
1861  */
1862 int __cond_resched_lock(spinlock_t *lock)
1863 {
1864         printk("\n__cond_resched_lock");
1865
1866         return 0;
1867 }
1868
1869 /*
1870  * kernel/sched/core.c:4315
1871  */
1872 static inline int should_resched(void)
1873 {
1874         return need_resched() && !(preempt_count() & PREEMPT_ACTIVE);
1875 }
1876
1877 static void __cond_resched(void)
1878 {
1879         add_preempt_count(PREEMPT_ACTIVE);
1880         __schedule();
1881         sub_preempt_count(PREEMPT_ACTIVE);
1882 }
1883
1884 int __sched _cond_resched(void)
1885 {
1886         if (should_resched()) {
1887                 __cond_resched();
1888                 return 1;
1889         }
1890         return 0;
1891 }
1892 EXPORT_SYMBOL(_cond_resched);
1893
1894 /*
1895  * kernel/sched/core.c:4333
1896  */
1897 int default_wake_function(wait_queue_t *curr, unsigned mode, int wake_flags, void *key)
1898 {
1899         return try_to_wake_up(curr->private, mode, wake_flags);
1900 }
1901 EXPORT_SYMBOL(default_wake_function);
1902
1903 /**
1904  * kernel/sched/core.c:3426
1905  * wait_for_completion_killable: - waits for completion of a task (killable)
1906  * @x:  holds the state of this particular completion
1907  *
1908  * This waits to be signaled for completion of a specific task. It can be
1909  * interrupted by a kill signal.
1910  *
1911  * The return value is -ERESTARTSYS if interrupted, 0 if completed.
1912  */
1913 int __sched wait_for_completion_killable(struct completion *x)
1914 {
1915         long t = wait_for_common(x, MAX_SCHEDULE_TIMEOUT, TASK_KILLABLE);
1916         if (t == -ERESTARTSYS)
1917                 return t;
1918         return 0;
1919 }
1920 EXPORT_SYMBOL(wait_for_completion_killable);
1921
1922 /**
1923  * kernel/sched/core.c:3192
1924  * __wake_up_sync_key - wake up threads blocked on a waitqueue.
1925  * @q: the waitqueue
1926  * @mode: which threads
1927  * @nr_exclusive: how many wake-one or wake-many threads to wake up
1928  * @key: opaque value to be passed to wakeup targets
1929  *
1930  * The sync wakeup differs that the waker knows that it will schedule
1931  * away soon, so while the target thread will be woken up, it will not
1932  * be migrated to another CPU - ie. the two threads are 'synchronized'
1933  * with each other. This can prevent needless bouncing between CPUs.
1934  *
1935  * On UP it can prevent extra preemption.
1936  *
1937  * It may be assumed that this function implies a write memory barrier before
1938  * changing the task state if and only if any tasks are woken up.
1939  */
1940 void __wake_up_sync_key(wait_queue_head_t *q, unsigned int mode,
1941                         int nr_exclusive, void *key)
1942 {
1943         unsigned long flags;
1944         int wake_flags = WF_SYNC;
1945
1946         if (unlikely(!q))
1947                 return;
1948
1949         if (unlikely(!nr_exclusive))
1950                 wake_flags = 0;
1951
1952         spin_lock_irqsave(&q->lock, flags);
1953         __wake_up_common(q, mode, nr_exclusive, wake_flags, key);
1954         spin_unlock_irqrestore(&q->lock, flags);
1955 }
1956 EXPORT_SYMBOL_GPL(__wake_up_sync_key);
1957
1958 /*
1959  * kernel/sched/core.c:1543
1960  */
1961 int wake_up_state(struct task_struct *p, unsigned int state)
1962 {
1963         WARN_ON(task_is_stopped_or_traced(p));
1964         return try_to_wake_up(p, state, 0);
1965 }
1966 EXPORT_SYMBOL(wake_up_process);
1967
1968 /**
1969  * kernel/sched/core.c:4389
1970  * yield - yield the current processor to other threads.
1971  *
1972  * Do not ever use this function, there's a 99% chance you're doing it wrong.
1973  *
1974  * The scheduler is at all times free to pick the calling task as the most
1975  * eligible task to run, if removing the yield() call from your code breaks
1976  * it, its already broken.
1977  *
1978  * Typical broken usage is:
1979  *
1980  * while (!event)
1981  *      yield();
1982  *
1983  * where one assumes that yield() will let 'the other' process run that will
1984  * make event true. If the current task is a SCHED_FIFO task that will never
1985  * happen. Never use yield() as a progress guarantee!!
1986  *
1987  * If you want to use yield() to wait for something, use wait_event().
1988  * If you want to use yield() to be 'nice' for others, use cond_resched().
1989  * If you still want to use yield(), do not!
1990  */
1991 void __sched yield(void)
1992 {
1993         printk("\nyield");
1994
1995         // TODO: SMP
1996
1997         return;
1998 }
1999
2000 /**
2001  * kernel/sched/core.c:892
2002  * task_curr - is this task currently executing on a CPU?
2003  * @p: the task in question.
2004  */
2005 inline int task_curr(const struct task_struct *p)
2006 {
2007         printk("\ntask_curr");
2008
2009         // TODO: SMP
2010
2011         return 0;
2012 }
2013
2014 /**
2015  * kernel/sched/core.c:3736
2016  * task_nice - return the nice value of a given task.
2017  * @p: the task in question.
2018  */
2019 int task_nice(const struct task_struct *p)
2020 {
2021         printk("\ntask_nice");
2022
2023         return 0;
2024 }
2025
2026 /*
2027  * kernel/sched/core.c:3616
2028  */
2029 void set_user_nice(struct task_struct *p, long nice)
2030 {
2031 //      printk("\nset_user_nice");
2032
2033         return;
2034 }
2035
2036 /*
2037  * kernel/sched/core.c:3169
2038  */
2039 void __wake_up_locked_key(wait_queue_head_t *q, unsigned int mode, void *key)
2040 {
2041         printk("\n__wake_up_locked_key");
2042
2043         return;
2044 }
2045
2046 /*
2047  * kernel/sched/core.c:4474
2048  * This task is about to go to sleep on IO. Increment rq->nr_iowait so
2049  * that process accounting knows that this is a task in IO wait state.
2050  */
2051 void __sched io_schedule(void)
2052 {
2053 //      printk("\nio_schedule");
2054
2055         struct rq *rq = raw_rq();
2056
2057         delayacct_blkio_start();
2058         atomic_inc(&rq->nr_iowait);
2059         blk_flush_plug(current);
2060         current->in_iowait = 1;
2061         schedule();
2062         current->in_iowait = 0;
2063         atomic_dec(&rq->nr_iowait);
2064         delayacct_blkio_end();
2065 }
2066 EXPORT_SYMBOL(io_schedule);
2067
2068 /*
2069  * kernel/sched/core.c:4489
2070  */
2071 long __sched io_schedule_timeout(long timeout)
2072 {
2073 //      printk("\nio_schedule_timeout");
2074         struct rq *rq = raw_rq();
2075         long ret;
2076
2077         delayacct_blkio_start();
2078         atomic_inc(&rq->nr_iowait);
2079         blk_flush_plug(current);
2080         current->in_iowait = 1;
2081         ret = schedule_timeout(timeout);
2082         current->in_iowait = 0;
2083         atomic_dec(&rq->nr_iowait);
2084         delayacct_blkio_end();
2085         return ret;
2086 }
2087
2088
2089 /*
2090  * kernel/sched/core.c:7590
2091  */
2092 int sched_rt_handler(struct ctl_table *table, int write,
2093                 void __user *buffer, size_t *lenp,
2094                 loff_t *ppos)
2095 {
2096         //printk("\nsched_rt_handler");
2097
2098         return 0;
2099 }
2100
2101 /*
2102  * kernel/sched/core.c:3213
2103  * __wake_up_sync - see __wake_up_sync_key()
2104  */
2105 void __wake_up_sync(wait_queue_head_t *q, unsigned int mode, int nr_exclusive)
2106 {
2107         printk("\n__wake_up_sync");
2108
2109         return;
2110 }
2111
2112 /*
2113  * kernel/sched/core.c:3163
2114  * Same as __wake_up but called with the spinlock in wait_queue_head_t held.
2115  */
2116 void __wake_up_locked(wait_queue_head_t *q, unsigned int mode, int nr)
2117 {
2118         printk("\n__wake_up_locked");
2119
2120         return;
2121 }
2122
2123 /**
2124  * kernel/sched/core.c:3307
2125  */
2126 static long __sched
2127 wait_for_common_io(struct completion *x, long timeout, int state)
2128 {
2129         return __wait_for_common(x, io_schedule_timeout, timeout, state);
2130 }
2131
2132 /**
2133  * kernel/sched/core.c:3355
2134  * wait_for_completion_io: - waits for completion of a task
2135  * @x:  holds the state of this particular completion
2136  *
2137  * This waits to be signaled for completion of a specific task. It is NOT
2138  * interruptible and there is no timeout. The caller is accounted as waiting
2139  * for IO.
2140  */
2141 void __sched wait_for_completion_io(struct completion *x)
2142 {
2143         wait_for_common_io(x, MAX_SCHEDULE_TIMEOUT, TASK_UNINTERRUPTIBLE);
2144 }
2145 EXPORT_SYMBOL(wait_for_completion_io);
2146
2147 /**
2148  * kernel/sched/core.c:3416
2149  * wait_for_completion_io_timeout: - waits for completion of a task (w/timeout)
2150  * @x:  holds the state of this particular completion
2151  * @timeout:  timeout value in jiffies
2152  *
2153  * This waits for either a completion of a specific task to be signaled or for a
2154  * specified timeout to expire. The timeout is in jiffies. It is not
2155  * interruptible. The caller is accounted as waiting for IO.
2156  *
2157  * The return value is 0 if timed out, and positive (at least 1, or number of
2158  * jiffies left till timeout) if completed.
2159  */
2160 unsigned long __sched
2161 wait_for_completion_io_timeout(struct completion *x, unsigned long timeout)
2162 {
2163         return wait_for_common_io(x, timeout, TASK_UNINTERRUPTIBLE);
2164 }
2165 EXPORT_SYMBOL(wait_for_completion_io_timeout);
2166
2167 /*
2168  * kernel/sched/core.c:4634
2169  */
2170 void show_state_filter(unsigned long state_filter)
2171 {
2172         //printk("\nshow_state_filter");
2173
2174         return;
2175 }
2176
2177 /**
2178  * kernel/sched/core.c:3251
2179  * complete_all: - signals all threads waiting on this completion
2180  * @x:  holds the state of this particular completion
2181  *
2182  * This will wake up all threads waiting on this particular completion event.
2183  *
2184  * It may be assumed that this function implies a write memory barrier before
2185  * changing the task state if and only if any tasks are woken up.
2186  */
2187 void complete_all(struct completion *x)
2188 {
2189         unsigned long flags;
2190
2191         spin_lock_irqsave(&x->wait.lock, flags);
2192         x->done += UINT_MAX/2;
2193         __wake_up_common(&x->wait, TASK_NORMAL, 0, 0, NULL);
2194         spin_unlock_irqrestore(&x->wait.lock, flags);
2195 }
2196 EXPORT_SYMBOL(complete_all);
2197
2198 /**
2199  * kernel/sched/core.c:3341
2200  * wait_for_completion_timeout: - waits for completion of a task (w/timeout)
2201  * @x:  holds the state of this particular completion
2202  * @timeout:  timeout value in jiffies
2203  *
2204  * This waits for either a completion of a specific task to be signaled or for a
2205  * specified timeout to expire. The timeout is in jiffies. It is not
2206  * interruptible.
2207  *
2208  * The return value is 0 if timed out, and positive (at least 1, or number of
2209  * jiffies left till timeout) if completed.
2210  */
2211 unsigned long __sched
2212 wait_for_completion_timeout(struct completion *x, unsigned long timeout)
2213 {
2214         return wait_for_common(x, timeout, TASK_UNINTERRUPTIBLE);
2215 }
2216 EXPORT_SYMBOL(wait_for_completion_timeout);
2217
2218
2219
2220 /*
2221  *
2222  * SMP
2223  *
2224  */
2225 #ifdef CONFIG_SMP
2226
2227 struct migration_arg {
2228         struct task_struct *task;
2229         int dest_cpu;
2230 };
2231
2232 /*
2233  * kernel/sched/core.c:4822
2234  * Move (not current) task off this cpu, onto dest cpu. We're doing
2235  * this because either it can't run here any more (set_cpus_allowed()
2236  * away from this CPU, or CPU going down), or because we're
2237  * attempting to rebalance this task on exec (sched_exec).
2238  *
2239  * So we race with normal scheduler movements, but that's OK, as long
2240  * as the task is no longer on this CPU.
2241  *
2242  * Returns non-zero if task was successfully migrated.
2243  */
2244 static int __migrate_task(struct task_struct *p, int src_cpu, int dest_cpu)
2245 {
2246
2247         struct rq *rq_dest, *rq_src;
2248         int ret = 0;
2249
2250         //TODO: testen!
2251         printk("!!MIGRIERE deb task %d zur cpu %d\n",p->pid,dest_cpu);
2252
2253         if (unlikely(!cpu_active(dest_cpu)))
2254                 return ret;
2255
2256         rq_src = cpu_rq(src_cpu);
2257         rq_dest = cpu_rq(dest_cpu);
2258
2259         raw_spin_lock(&p->pi_lock);
2260         double_rq_lock(rq_src, rq_dest);
2261         /* Already moved. */
2262         if (task_cpu(p) != src_cpu)
2263                 goto done;
2264         /* Affinity changed (again). */
2265         if (!cpumask_test_cpu(dest_cpu, tsk_cpus_allowed(p)))
2266                 goto fail;
2267
2268         /*
2269          * If we're not on a rq, the next wake-up will ensure we're
2270          * placed properly.
2271          */
2272         if (p->on_rq) {
2273 //              dequeue_task(rq_src, p, 0);
2274                 list_del(&p->rq_tasks);
2275                 // TODO: maybe not necessary hence double lock
2276                 p->on_rq = 0;
2277                 set_task_cpu(p, dest_cpu);
2278 //              enqueue_task(rq_dest, p, 0);
2279                 list_add(&p->rq_tasks, &rq_dest->rq_list);
2280                 // TODO: maybe not necessary hence double lock
2281                 p->on_rq = 1;
2282 //              check_preempt_curr(rq_dest, p, 0);
2283                 if (rq_dest->curr == rq_dest->idle)
2284                         resched_task(rq_dest->curr);
2285         }
2286 done:
2287         ret = 1;
2288 fail:
2289         double_rq_unlock(rq_src, rq_dest);
2290         raw_spin_unlock(&p->pi_lock);
2291         return ret;
2292 }
2293
2294 /*
2295  * kernel/sched/core:4865
2296  * migration_cpu_stop - this will be executed by a highprio stopper thread
2297  * and performs thread migration by bumping thread off CPU then
2298  * 'pushing' onto another runqueue.
2299  */
2300 static int migration_cpu_stop(void *data)
2301 {
2302         struct migration_arg *arg = data;
2303
2304         /*
2305          * The original target cpu might have gone down and we might
2306          * be on another cpu but it doesn't matter.
2307          */
2308         local_irq_disable();
2309         __migrate_task(arg->task, raw_smp_processor_id(), arg->dest_cpu);
2310         local_irq_enable();
2311         return 0;
2312 }
2313
2314
2315 static void set_rq_online(struct rq *rq)
2316 {
2317         if (!rq->online)
2318                 rq->online = 1;
2319 }
2320
2321 /*
2322 static void set_rq_offline(struct rq *rq)
2323 {
2324         if (rq->online)
2325                 rq->online = 0;
2326 }
2327 */
2328
2329 /*
2330  * migration_call - callback that gets triggered when a CPU is added.
2331  * Here we can start up the necessary migration thread for the new CPU.
2332  */
2333 static int __cpuinit
2334 migration_call(struct notifier_block *nfb, unsigned long action, void *hcpu)
2335 {
2336         int cpu = (long)hcpu;
2337         unsigned long flags;
2338         struct rq *rq = cpu_rq(cpu);
2339
2340         switch (action & ~CPU_TASKS_FROZEN) {
2341
2342         case CPU_UP_PREPARE:
2343 //              rq->calc_load_update = calc_load_update;
2344                 break;
2345
2346         case CPU_ONLINE:
2347                 /* Update our root-domain */
2348                 raw_spin_lock_irqsave(&rq->lock, flags);
2349 //              if (rq->rd) {
2350 //                      BUG_ON(!cpumask_test_cpu(cpu, rq->rd->span));
2351 //
2352                         set_rq_online(rq);
2353 //              }
2354                 raw_spin_unlock_irqrestore(&rq->lock, flags);
2355                 break;
2356
2357 #ifdef CONFIG_HOTPLUG_CPU
2358         case CPU_DYING:
2359                 sched_ttwu_pending();
2360                 /* Update our root-domain */
2361                 raw_spin_lock_irqsave(&rq->lock, flags);
2362 //              if (rq->rd) {
2363 //                      BUG_ON(!cpumask_test_cpu(cpu, rq->rd->span));
2364                         set_rq_offline(rq);
2365 //              }
2366                 migrate_tasks(cpu);
2367                 BUG_ON(rq->nr_running != 1); /* the migration thread */
2368                 raw_spin_unlock_irqrestore(&rq->lock, flags);
2369                 break;
2370
2371         case CPU_DEAD:
2372 //              calc_load_migrate(rq);
2373                 break;
2374 #endif
2375         }
2376
2377 //      update_max_interval();
2378
2379         return NOTIFY_OK;
2380 }
2381
2382 /*
2383  * Register at high priority so that task migration (migrate_all_tasks)
2384  * happens before everything else.  This has to be lower priority than
2385  * the notifier in the perf_event subsystem, though.
2386  */
2387 static struct notifier_block __cpuinitdata migration_notifier = {
2388         .notifier_call = migration_call,
2389         .priority = CPU_PRI_MIGRATION,
2390 };
2391
2392 static int __cpuinit sched_cpu_active(struct notifier_block *nfb,
2393                                       unsigned long action, void *hcpu)
2394 {
2395         switch (action & ~CPU_TASKS_FROZEN) {
2396         case CPU_STARTING:
2397         case CPU_DOWN_FAILED:
2398                 set_cpu_active((long)hcpu, true);
2399                 return NOTIFY_OK;
2400         default:
2401                 return NOTIFY_DONE;
2402         }
2403 }
2404
2405 static int __cpuinit sched_cpu_inactive(struct notifier_block *nfb,
2406                                         unsigned long action, void *hcpu)
2407 {
2408         switch (action & ~CPU_TASKS_FROZEN) {
2409         case CPU_DOWN_PREPARE:
2410                 set_cpu_active((long)hcpu, false);
2411                 return NOTIFY_OK;
2412         default:
2413                 return NOTIFY_DONE;
2414         }
2415 }
2416
2417 static int __init migration_init(void)
2418 {
2419         void *cpu = (void *)(long)smp_processor_id();
2420         int err;
2421
2422         /* Initialize migration for the boot CPU */
2423         err = migration_call(&migration_notifier, CPU_UP_PREPARE, cpu);
2424         BUG_ON(err == NOTIFY_BAD);
2425         migration_call(&migration_notifier, CPU_ONLINE, cpu);
2426         register_cpu_notifier(&migration_notifier);
2427
2428         /* Register cpu active notifiers */
2429         cpu_notifier(sched_cpu_active, CPU_PRI_SCHED_ACTIVE);
2430         cpu_notifier(sched_cpu_inactive, CPU_PRI_SCHED_INACTIVE);
2431
2432         return 0;
2433 }
2434 early_initcall(migration_init);
2435
2436
2437
2438 void do_set_cpus_allowed(struct task_struct *p,
2439                                const struct cpumask *new_mask)
2440 {
2441 //      if (p->sched_class && p->sched_class->set_cpus_allowed)
2442 //              p->sched_class->set_cpus_allowed(p, new_mask);
2443
2444         cpumask_copy(&p->cpus_allowed, new_mask);
2445         p->nr_cpus_allowed = cpumask_weight(new_mask);
2446 }
2447
2448 int set_cpus_allowed_ptr(struct task_struct *p, const struct cpumask *new_mask)
2449 {
2450         unsigned long flags;
2451         struct rq *rq;
2452         unsigned int dest_cpu;
2453         int ret = 0;
2454
2455         rq = task_rq_lock(p, &flags);
2456
2457         if (cpumask_equal(&p->cpus_allowed, new_mask))
2458                 goto out;
2459
2460         if (!cpumask_intersects(new_mask, cpu_active_mask)) {
2461                 ret = -EINVAL;
2462                 goto out;
2463         }
2464
2465         if (unlikely((p->flags & PF_THREAD_BOUND) && p != current)) {
2466                 ret = -EINVAL;
2467                 goto out;
2468         }
2469
2470         do_set_cpus_allowed(p, new_mask);
2471
2472         /* Can the task run on the task's current CPU? If so, we're done */
2473         if (cpumask_test_cpu(task_cpu(p), new_mask))
2474                 goto out;
2475
2476         dest_cpu = cpumask_any_and(cpu_active_mask, new_mask);
2477         if (p->on_rq) {
2478                 struct migration_arg arg = { p, dest_cpu };
2479                 /* Need help from migration thread: drop lock and wait. */
2480                 task_rq_unlock(rq, p, &flags);
2481                 stop_one_cpu(cpu_of(rq), migration_cpu_stop, &arg);
2482                 tlb_migrate_finish(p->mm);
2483                 return 0;
2484         }
2485 out:
2486         task_rq_unlock(rq, p, &flags);
2487
2488         return ret;
2489 }
2490 EXPORT_SYMBOL_GPL(set_cpus_allowed_ptr);
2491
2492 static void sched_ttwu_pending(void)
2493 {
2494         struct rq *rq = this_rq();
2495         struct llist_node *llist = llist_del_all(&rq->wake_list);
2496         struct task_struct *p;
2497
2498         raw_spin_lock(&rq->lock);
2499
2500         while (llist) {
2501                 p = llist_entry(llist, struct task_struct, wake_entry);
2502                 llist = llist_next(llist);
2503                 ttwu_do_activate(rq, p, 0);
2504         }
2505
2506         raw_spin_unlock(&rq->lock);
2507 }
2508
2509 void scheduler_ipi(void)
2510 {
2511         if (llist_empty(&this_rq()->wake_list)) // && !got_nohz_idle_kick())
2512                         return;
2513
2514         /*
2515          * Not all reschedule IPI handlers call irq_enter/irq_exit, since
2516          * traditionally all their work was done from the interrupt return
2517          * path. Now that we actually do some work, we need to make sure
2518          * we do call them.
2519          *
2520          * Some archs already do call them, luckily irq_enter/exit nest
2521          * properly.
2522          *
2523          * Arguably we should visit all archs and update all handlers,
2524          * however a fair share of IPIs are still resched only so this would
2525          * somewhat pessimize the simple resched case.
2526          */
2527         irq_enter();
2528         sched_ttwu_pending();
2529
2530         /*
2531          * Check if someone kicked us for doing the nohz idle load balance.
2532          */
2533         if (unlikely(/*got_nohz_idle_kick() && */!need_resched())) {
2534 //              this_rq()->idle_balance = 1;
2535                 raise_softirq_irqoff(SCHED_SOFTIRQ);
2536         }
2537         irq_exit();
2538 }
2539
2540 /*
2541  * kernel/sched/core.c:1011
2542  * wait_task_inactive - wait for a thread to unschedule.
2543  *
2544  * If @match_state is nonzero, it's the @p->state value just checked and
2545  * not expected to change.  If it changes, i.e. @p might have woken up,
2546  * then return zero.  When we succeed in waiting for @p to be off its CPU,
2547  * we return a positive number (its total switch count).  If a second call
2548  * a short while later returns the same number, the caller can be sure that
2549  * @p has remained unscheduled the whole time.
2550  *
2551  * The caller must ensure that the task *will* unschedule sometime soon,
2552  * else this function might spin for a *long* time. This function can't
2553  * be called with interrupts off, or it may introduce deadlock with
2554  * smp_call_function() if an IPI is sent by the same process we are
2555  * waiting to become inactive.
2556  */
2557 unsigned long wait_task_inactive(struct task_struct *p, long match_state)
2558 {
2559         unsigned long flags;
2560         int running, on_rq;
2561         unsigned long ncsw;
2562         struct rq *rq;
2563
2564         for (;;) {
2565                 /*
2566                  * We do the initial early heuristics without holding
2567                  * any task-queue locks at all. We'll only try to get
2568                  * the runqueue lock when things look like they will
2569                  * work out!
2570                  */
2571                 rq = task_rq(p);
2572
2573                 /*
2574                  * If the task is actively running on another CPU
2575                  * still, just relax and busy-wait without holding
2576                  * any locks.
2577                  *
2578                  * NOTE! Since we don't hold any locks, it's not
2579                  * even sure that "rq" stays as the right runqueue!
2580                  * But we don't care, since "task_running()" will
2581                  * return false if the runqueue has changed and p
2582                  * is actually now running somewhere else!
2583                  */
2584                 while (task_running(rq, p)) {
2585                         if (match_state && unlikely(p->state != match_state))
2586                                 return 0;
2587                         cpu_relax();
2588                 }
2589
2590                 /*
2591                  * Ok, time to look more closely! We need the rq
2592                  * lock now, to be *sure*. If we're wrong, we'll
2593                  * just go back and repeat.
2594                  */
2595                 rq = task_rq_lock(p, &flags);
2596 //              trace_sched_wait_task(p);
2597                 running = task_running(rq, p);
2598                 on_rq = p->on_rq;
2599                 ncsw = 0;
2600                 if (!match_state || p->state == match_state)
2601                         ncsw = p->nvcsw | LONG_MIN; /* sets MSB */
2602                 task_rq_unlock(rq, p, &flags);
2603
2604                 /*
2605                  * If it changed from the expected state, bail out now.
2606                  */
2607                 if (unlikely(!ncsw))
2608                         break;
2609
2610                 /*
2611                  * Was it really running after all now that we
2612                  * checked with the proper locks actually held?
2613                  *
2614                  * Oops. Go back and try again..
2615                  */
2616                 if (unlikely(running)) {
2617                         cpu_relax();
2618                         continue;
2619                 }
2620
2621                 /*
2622                  * It's not enough that it's not actively running,
2623                  * it must be off the runqueue _entirely_, and not
2624                  * preempted!
2625                  *
2626                  * So if it was still runnable (but just not actively
2627                  * running right now), it's preempted, and we should
2628                  * yield - it could be a while.
2629                  */
2630                 if (unlikely(on_rq)) {
2631                         ktime_t to = ktime_set(0, NSEC_PER_SEC/HZ);
2632
2633                         set_current_state(TASK_UNINTERRUPTIBLE);
2634                         schedule_hrtimeout(&to, HRTIMER_MODE_REL);
2635                         continue;
2636                 }
2637
2638                 /*
2639                  * Ahh, all good. It wasn't running, and it wasn't
2640                  * runnable, which means that it will never become
2641                  * running in the future either. We're all done!
2642                  */
2643                 break;
2644         }
2645
2646         return ncsw;
2647 }
2648
2649 /***
2650  * kernel/sched/core:1116
2651  * kick_process - kick a running thread to enter/exit the kernel
2652  * @p: the to-be-kicked thread
2653  *
2654  * Cause a process which is running on another CPU to enter
2655  * kernel-mode, without any delay. (to get signals handled.)
2656  *
2657  * NOTE: this function doesn't have to take the runqueue lock,
2658  * because all it wants to ensure is that the remote task enters
2659  * the kernel. If the IPI races and the task has been migrated
2660  * to another CPU then no harm is done and the purpose has been
2661  * achieved as well.
2662  */
2663 void kick_process(struct task_struct *p)
2664 {
2665         int cpu;
2666
2667         preempt_disable();
2668         cpu = task_cpu(p);
2669         if ((cpu != smp_processor_id()) && task_curr(p))
2670                 smp_send_reschedule(cpu);
2671         preempt_enable();
2672 }
2673 EXPORT_SYMBOL_GPL(kick_process);
2674
2675 void sched_set_stop_task(int cpu, struct task_struct *stop)
2676 {
2677         printk("\nsched_set_stop_task");
2678 }
2679
2680 bool completion_done(struct completion *x)
2681 {
2682         printk("\ncompletion_done");
2683
2684         return 0;
2685 }
2686
2687 /*
2688  * kernel/sched/core:2605
2689  * sched_exec - execve() is a valuable balancing opportunity, because at
2690  * this point the task has the smallest effective memory and cache footprint.
2691  */
2692 void sched_exec(void)
2693 {
2694         struct task_struct *p = current;
2695         unsigned long flags;
2696         int dest_cpu;
2697
2698         raw_spin_lock_irqsave(&p->pi_lock, flags);
2699         dest_cpu = select_task_rq(p, SD_BALANCE_EXEC, 0);
2700         if (dest_cpu == smp_processor_id())
2701                 goto unlock;
2702
2703         if (likely(cpu_active(dest_cpu))) {
2704                 struct migration_arg arg = { p, dest_cpu };
2705
2706                 raw_spin_unlock_irqrestore(&p->pi_lock, flags);
2707                 stop_one_cpu(task_cpu(p), migration_cpu_stop, &arg);
2708                 return;
2709         }
2710 unlock:
2711         raw_spin_unlock_irqrestore(&p->pi_lock, flags);
2712 }
2713
2714 void set_task_cpu(struct task_struct *p, unsigned int new_cpu)
2715 {
2716 #ifdef CONFIG_SCHED_DEBUG
2717         /*
2718          * We should never call set_task_cpu() on a blocked task,
2719          * ttwu() will sort out the placement.
2720          */
2721         WARN_ON_ONCE(p->state != TASK_RUNNING && p->state != TASK_WAKING &&
2722                         !(task_thread_info(p)->preempt_count & PREEMPT_ACTIVE));
2723
2724 #ifdef CONFIG_LOCKDEP
2725         /*
2726          * The caller should hold either p->pi_lock or rq->lock, when changing
2727          * a task's CPU. ->pi_lock for waking tasks, rq->lock for runnable tasks.
2728          *
2729          * sched_move_task() holds both and thus holding either pins the cgroup,
2730          * see task_group().
2731          *
2732          * Furthermore, all task_rq users should acquire both locks, see
2733          * task_rq_lock().
2734          */
2735         WARN_ON_ONCE(debug_locks && !(lockdep_is_held(&p->pi_lock) ||
2736                                       lockdep_is_held(&task_rq(p)->lock)));
2737 #endif
2738 #endif
2739
2740         // TODO: SMP, needs to implemented while using load balancing
2741 //      trace_sched_migrate_task(p, new_cpu);
2742 //
2743 //      if (task_cpu(p) != new_cpu) {
2744 //              struct task_migration_notifier tmn;
2745 //
2746 //              if (p->sched_class->migrate_task_rq)
2747 //                      p->sched_class->migrate_task_rq(p, new_cpu);
2748 //              p->se.nr_migrations++;
2749 //              perf_sw_event(PERF_COUNT_SW_CPU_MIGRATIONS, 1, NULL, 0);
2750 //
2751 //              tmn.task = p;
2752 //              tmn.from_cpu = task_cpu(p);
2753 //              tmn.to_cpu = new_cpu;
2754 //
2755 //              atomic_notifier_call_chain(&task_migration_notifier, 0, &tmn);
2756 //      }
2757
2758         __set_task_cpu(p, new_cpu);
2759 }
2760
2761 /**
2762  * kernel/sched/core.c:6820
2763  */
2764 void __init sched_init_smp(void)
2765 {
2766         cpumask_var_t non_isolated_cpus;
2767
2768         alloc_cpumask_var(&non_isolated_cpus, GFP_KERNEL);
2769         alloc_cpumask_var(&fallback_doms, GFP_KERNEL);
2770
2771 //      sched_init_numa();
2772
2773         get_online_cpus();
2774         mutex_lock(&sched_domains_mutex);
2775 //      init_sched_domains(cpu_active_mask);
2776         cpumask_andnot(non_isolated_cpus, cpu_possible_mask, cpu_isolated_map);
2777         if (cpumask_empty(non_isolated_cpus))
2778                 cpumask_set_cpu(smp_processor_id(), non_isolated_cpus);
2779         mutex_unlock(&sched_domains_mutex);
2780         put_online_cpus();
2781
2782 //      hotcpu_notifier(sched_domains_numa_masks_update, CPU_PRI_SCHED_ACTIVE);
2783 //      hotcpu_notifier(cpuset_cpu_active, CPU_PRI_CPUSET_ACTIVE);
2784 //      hotcpu_notifier(cpuset_cpu_inactive, CPU_PRI_CPUSET_INACTIVE);
2785
2786         /* RT runtime code needs to handle some hotplug events */
2787 //      hotcpu_notifier(update_runtime, 0);
2788
2789 //      init_hrtick();
2790
2791         /* Move init over to a non-isolated CPU */
2792         if (set_cpus_allowed_ptr(current, non_isolated_cpus) < 0)
2793                 BUG();
2794 //      sched_init_granularity();
2795         free_cpumask_var(non_isolated_cpus);
2796
2797 //      init_sched_rt_class();
2798 }
2799
2800 bool cpus_share_cache(int this_cpu, int that_cpu)
2801 {
2802         return per_cpu(sd_llc_id, this_cpu) == per_cpu(sd_llc_id, that_cpu);
2803 }
2804
2805 #else
2806
2807 /**
2808  * kernel/sched/core.c:6856
2809  */
2810 void sched_init_smp(void)
2811 {
2812         //printk("\nsched_init_smp");
2813
2814         return;
2815 }
2816 #endif /* CONFIG_SMP */
2817
2818
2819
2820 /*
2821  * Syscalls
2822  *
2823  * Help:
2824  * SYSCALL_DEFINEx will be replaced by asmlinkage data_type function_name
2825  * asmlinkage:  tells the compile that the arguments of the function are
2826  *                              not placed in the registers but rather to find on stack
2827  */
2828
2829 /*
2830  * kernel/sched/core.c:3686
2831  * sys_nice - change the priority of the current process.
2832  * @increment: priority increment
2833  *
2834  * sys_setpriority is a more generic, but much slower function that
2835  * does similar things.
2836  */
2837 SYSCALL_DEFINE1(nice, int, increment)
2838 {
2839         printk("SYSCALL nice\n");
2840         return 0;
2841 }
2842
2843 /**
2844  * kernel/sched/core.c:4248
2845  * sys_sched_getaffinity - get the cpu affinity of a process
2846  * @pid: pid of the process
2847  * @len: length in bytes of the bitmask pointed to by user_mask_ptr
2848  * @user_mask_ptr: user-space pointer to hold the current cpu mask
2849  */
2850 SYSCALL_DEFINE3(sched_getaffinity, pid_t, pid, unsigned int, len,
2851                 unsigned long __user *, user_mask_ptr)
2852 {
2853         printk("SYSCALL sched_getaffinity\n");
2854         return 0;
2855 }
2856
2857 /**
2858  * kernel/sched/core.c:4197
2859  * sys_sched_setaffinity - set the cpu affinity of a process
2860  * @pid: pid of the process
2861  * @len: length in bytes of the bitmask pointed to by user_mask_ptr
2862  * @user_mask_ptr: user-space pointer to the new cpu mask
2863  */
2864 SYSCALL_DEFINE3(sched_setaffinity, pid_t, pid, unsigned int, len,
2865                 unsigned long __user *, user_mask_ptr)
2866 {
2867         printk("SYSCALL sched_setaffinity\n");
2868
2869         // TODO: SMP
2870
2871         return 0;
2872 }
2873
2874 /**
2875  * kernel/sched/core.c:4562
2876  * sys_sched_rr_get_interval - return the default timeslice of a process.
2877  * @pid: pid of the process.
2878  * @interval: userspace pointer to the timeslice value.
2879  *
2880  * this syscall writes the default timeslice value of a given process
2881  * into the user-space timespec buffer. A value of '0' means infinity.
2882  */
2883 SYSCALL_DEFINE2(sched_rr_get_interval, pid_t, pid,
2884                 struct timespec __user *, interval)
2885 {
2886         printk("SYSCALL sched_rr_get_interval\n");
2887         return 0;
2888 }
2889
2890 /**
2891  * kernel/sched/core.c:4282
2892  * sys_sched_yield - yield the current processor to other threads.
2893  *
2894  * This function yields the current CPU to other tasks. If there are no
2895  * other threads running on this CPU then this function will return.
2896  */
2897 SYSCALL_DEFINE0(sched_yield)
2898 {
2899         printk("SYSCALL sched_yield\n");
2900         return 0;
2901 }
2902
2903 /**
2904  * kernel/sched/core.c:4027
2905  * sys_sched_setscheduler - set/change the scheduler policy and RT priority
2906  * @pid: the pid in question.
2907  * @policy: new policy.
2908  * @param: structure containing the new RT priority.
2909  */
2910 SYSCALL_DEFINE3(sched_setscheduler, pid_t, pid, int, policy,
2911                 struct sched_param __user *, param)
2912 {
2913         return 0;
2914 }
2915
2916 /**
2917  * kernel/sched/core.c:4051
2918  * sys_sched_getscheduler - get the policy (scheduling class) of a thread
2919  * @pid: the pid in question.
2920  */
2921 SYSCALL_DEFINE1(sched_getscheduler, pid_t, pid)
2922 {
2923         return 0;
2924 }
2925
2926 /**
2927  * kernel/sched/core.c:4512
2928  * sys_sched_get_priority_max - return maximum RT priority.
2929  * @policy: scheduling class.
2930  *
2931  * this syscall returns the maximum rt_priority that can be used
2932  * by a given scheduling class.
2933  */
2934 SYSCALL_DEFINE1(sched_get_priority_max, int, policy)
2935 {
2936         return 0;
2937 }
2938
2939 /**
2940  * kernel/sched/core.c:4537
2941  * sys_sched_get_priority_min - return minimum RT priority.
2942  * @policy: scheduling class.
2943  *
2944  * this syscall returns the minimum rt_priority that can be used
2945  * by a given scheduling class.
2946  */
2947 SYSCALL_DEFINE1(sched_get_priority_min, int, policy)
2948 {
2949         return 0;
2950 }
2951
2952 /**
2953  * kernel/sched/core.c:4042
2954  * sys_sched_setparam - set/change the RT priority of a thread
2955  * @pid: the pid in question.
2956  * @param: structure containing the new RT priority.
2957  */
2958 SYSCALL_DEFINE2(sched_setparam, pid_t, pid, struct sched_param __user *, param)
2959 {
2960         return 0;
2961 }
2962
2963 /**
2964  * kernel/sched/core.c:4077
2965  * sys_sched_getparam - get the RT priority of a thread
2966  * @pid: the pid in question.
2967  * @param: structure containing the RT priority.
2968  */
2969 SYSCALL_DEFINE2(sched_getparam, pid_t, pid, struct sched_param __user *, param)
2970 {
2971         return 0;
2972 }